logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Havenask 分布式索引构建服务 --Build Service

Havenask 是阿里巴巴广泛使用的自研大规模分布式检索系统,是过去十多年阿里在电商领域积累下来的核心竞争力产品,广泛应用在搜推广和大数据检索等典型场景,在 2022 年云栖大会-云计算加速开源创新论坛上完成开源首发,同时作为阿里云开放搜索 OpenSearch 底层搜索引擎,OpenSearch 自 2014 年商业化,目前已有千余家外部客户。下图展示了 Havenask 中一个完整的搜索服务

文章图片
#分布式
万字详文,剖析企业数字化的降“本”增效

让我们一起从文章、案例中探寻数字化时代的成本与效能。

文章图片
#大数据#人工智能#云计算
从源码分析 vllm + Ray 的分布式推理流程

随着 LLM 模型越来越大,单 GPU 已经无法加载一个模型。以 Qwen-14B-Chat 模型为例,模型权重大概 28GB,但是单个 NVIDIA A10 仅有 24GB 显存。如果想要在 A10 上部署 Qwen-14B-Chat 模型,我们需要将模型切分后部署到 2 个 A10 机器上,每个 A10 卡加载一半的模型,这种方式称之为分布式推理。社区涌现了很多支持分布式推理的框架如 vllm

文章图片
#分布式#wpf
异地多活架构新突破:库存单元化部署技术思路揭秘

挑战库存跨机房单元化部署,实现真正的交易单元封闭。

文章图片
#架构#数据库#服务器
阿里TPP图化框架技术实践 — 打造算法在线服务领域极致开发体验与性能

作者:腾驹TPP图化致力于打造一个算法在线服务领域易用、性能极致、迭代效率远超普通方式的产品。本文将介绍TPP图化以及2021年在性能、开发体验上的改进,并介绍未来TPP图化的规划。一、背景TPP是阿里个性化算法开发平台,依托阿里AI·OS引擎(特征、召回、打分等引擎)为众多的个性化业务(搜索、推荐、广告等)提供Serverless化的在线服务能力。用户在TPP平台上编写业务代码,做AB实验并对

文章图片
#算法#big data
Master-Worker 架构的灰度发布难题

Master-Worker 架构是成熟的分布式系统设计模式,具有集中控制、资源利用率高、容错简单等优点。我们数据中心内的几乎所有分布式系统都采用了这样的架构。我们曾经发生过级联故障,造成了整个集群范围的服务中断。这让我们反思到 Master-Worker 架构难以有效的分批灰度发布的问题。本文试图分析其中原因,并尝试提出几种解决方案。防范集群范围的级联故联是分布式系统中的难题。本文提出了三种方法

文章图片
#架构#java#大数据
人工智能 LLM 革命前夜:一文读懂ChatGPT缘起的自然语言处理模型Transformer

对 ChatGPT 缘起的自然语言处理模型 Transformer,本文先梳理了该模型出现之前的几大主流语言模型,介绍了注意力机制,再基于此深入浅出讲解 Transformer,并在最后为大家解读一个基于 TensorFlow 架构的 Transformer 实现。

文章图片
#人工智能#自然语言处理
IP报文在阿里云上的神奇之旅:同地域内云上通信

一个IP报文如何跨越万水千山达到目的地?本文将带大家一起探索同地域内云上通信的全过程。

文章图片
#tcp/ip#阿里云#网络
ICASSP 2023 | 深度窄带网络消除实时语音通信中的干扰音

阿里巴巴钉钉蜂鸣鸟音频实验室提出了一种基于频-时调制谱的改进型窄带滤波网络,“一模型,多任务”,联合消除实时语音通信中常见的三种干扰音(回声,噪音和混响)。

文章图片
#网络#人工智能#语音识别 +1
如何创造一个能和你对话的语音AI?

过去十年,语音AI从实验室走向应用,语音搜索、交互早已融入日常。本文将带你一览达摩院语音AI技术创新全景,一起感受能听、会说、懂你的语音AI。

文章图片
#人工智能#语音识别
    共 63 条
  • 1
  • 2
  • 3
  • 7
  • 请选择