
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
Havenask 是阿里巴巴广泛使用的自研大规模分布式检索系统,是过去十多年阿里在电商领域积累下来的核心竞争力产品,广泛应用在搜推广和大数据检索等典型场景,在 2022 年云栖大会-云计算加速开源创新论坛上完成开源首发,同时作为阿里云开放搜索 OpenSearch 底层搜索引擎,OpenSearch 自 2014 年商业化,目前已有千余家外部客户。下图展示了 Havenask 中一个完整的搜索服务

让我们一起从文章、案例中探寻数字化时代的成本与效能。

随着 LLM 模型越来越大,单 GPU 已经无法加载一个模型。以 Qwen-14B-Chat 模型为例,模型权重大概 28GB,但是单个 NVIDIA A10 仅有 24GB 显存。如果想要在 A10 上部署 Qwen-14B-Chat 模型,我们需要将模型切分后部署到 2 个 A10 机器上,每个 A10 卡加载一半的模型,这种方式称之为分布式推理。社区涌现了很多支持分布式推理的框架如 vllm

挑战库存跨机房单元化部署,实现真正的交易单元封闭。

作者:腾驹TPP图化致力于打造一个算法在线服务领域易用、性能极致、迭代效率远超普通方式的产品。本文将介绍TPP图化以及2021年在性能、开发体验上的改进,并介绍未来TPP图化的规划。一、背景TPP是阿里个性化算法开发平台,依托阿里AI·OS引擎(特征、召回、打分等引擎)为众多的个性化业务(搜索、推荐、广告等)提供Serverless化的在线服务能力。用户在TPP平台上编写业务代码,做AB实验并对

Master-Worker 架构是成熟的分布式系统设计模式,具有集中控制、资源利用率高、容错简单等优点。我们数据中心内的几乎所有分布式系统都采用了这样的架构。我们曾经发生过级联故障,造成了整个集群范围的服务中断。这让我们反思到 Master-Worker 架构难以有效的分批灰度发布的问题。本文试图分析其中原因,并尝试提出几种解决方案。防范集群范围的级联故联是分布式系统中的难题。本文提出了三种方法

对 ChatGPT 缘起的自然语言处理模型 Transformer,本文先梳理了该模型出现之前的几大主流语言模型,介绍了注意力机制,再基于此深入浅出讲解 Transformer,并在最后为大家解读一个基于 TensorFlow 架构的 Transformer 实现。

一个IP报文如何跨越万水千山达到目的地?本文将带大家一起探索同地域内云上通信的全过程。

阿里巴巴钉钉蜂鸣鸟音频实验室提出了一种基于频-时调制谱的改进型窄带滤波网络,“一模型,多任务”,联合消除实时语音通信中常见的三种干扰音(回声,噪音和混响)。

过去十年,语音AI从实验室走向应用,语音搜索、交互早已融入日常。本文将带你一览达摩院语音AI技术创新全景,一起感受能听、会说、懂你的语音AI。








