logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

MLLM在电商域互动内容生产的实践

作为一种新的商品表现形态,内容几乎存在于手淘用户动线全流程,例如信息流种草内容、搜索消费决策内容、详情页种草内容等。过去一年,我们通过在视频生成、图文联合生成等核心技术上的持续攻关,AIGC内容生成在手淘多个场景取得了规模化落地价值。本专题《淘宝的AIGC内容生成技术总结》是我们摸索出的一部分实践经验,我们将开启一段时间的内容AI专题连载,欢迎大家一起交流进步。第一篇《淘宝内容AI团队2024年8

#人工智能
聊聊AI应用架构演进

RAG中的缓存设计,主要是面向精准匹配的缓存,比如面对相同的用于做知识库内容检索的query,可以快速从缓存中返回结果,因为当知识库变得丰富的同时,在做检索的时候,需要涉及到的向量计算量大且耗时,同时在一些使用场景中,知识库中的知识可能会存在一些热点内容,这时候缓存这部分知识的Index和body,对于整体推理提效会有不错的效果。Context增强的核心目标是针对用户的query,补充最相关、最必

#人工智能#架构
大模型微调知识与实践分享

此外,Transformer的权重矩阵包括Attention模块里用于计算query, key, value的Wq,Wk,Wv以及多头attention的Wo,以及MLP层的权重矩阵,LoRA只应用于Attention模块中的4种权重矩阵,而且通过消融实验发现同时调整 Wq 和 Wv 会产生最佳结果。提升模型在正样本上的概率(优化模型在正样本上的概率 大于 参考模型在正样本上的概率), 降低模型在

淘宝直播数字人LLM推理优化:模型蒸馏与路径压缩实践

本专题是我们打造智能数字人的部分实践总结。我们将探讨六大核心环节:LLM文案生产赋予数字人思考和内容生成能力,如同其“大脑”;LLM互动能力则聚焦对话逻辑与拟人化交流,是实现自然交互的关键;TTS(语音合成)技术负责将文字转化为富含情感、个性化的“声音”;形象驱动技术让语音与表情、口型、肢体动作精准同步,塑造逼真视觉形象;音视频工程解决实时渲染、低延迟传输与高质量画面输出的技术挑战;最后,服务端工

大模型时代的内容分析Agent解决方案与业务实践

一种新的商品表现形态,内容几乎存在于手淘用户动线全流程,例如信息流种草内容、搜索消费决策内容、详情页种草内容等。通过低成本、高时效的AIGC内容生成能力,能够从供给端缓解内容生产成本高的问题,通过源源不断的低成本供给倒推消费生态的建立。过去一年,我们通过在视频生成、图文联合生成、个性化文案、人设Agent等核心技术上的持续攻关,AIGC内容生成在手淘多个场景取得了规模化落地价值。本专题《淘宝的AI

Agent工程能力思考记录

除了HSF,其实还有很多业务团队常用的接入诉求,比如SLS日志查询的接入,ODPS表读取的接入,IDEAs服务的接入等,这些能力可以快速支撑起一个简单的应用场景,譬如我之前文章里面的FlowLink原子能力接入后台、多啦a梦平台,本质上都是做的工具接入提效;对于MCP中心来说,也可以通过一些更通用的工程化手段来处理,比如在服务发现的末端,基于用户的请求前置过滤一些与本次无关的工具,可以是通过向量相

淘宝直播数字人:音视频&算法工程技术

团队基于对大语言模型研发、多模态语义理解、语音合成、数字人形象建模、AI工程化部署及音视频处理技术的深厚沉淀和积累,已搭建起覆盖直播全链路的AI技术矩阵。以淘宝直播为例,在直播的过程主要包括了音视频采集、渲染/混音、编码、传输/协议、GRTN、播放器这几个主要的环节。数字记忆:克隆自己、亲人的人设、声音、形象,保留一份永久的分身和记忆,留给自己与儿女!自营商家:天猫超市,喵速达,淘宝秒杀,百亿补贴

#音视频
技术人的大模型应用初学指南

基于已有开源大模型进行微调训练,如果采用预训练的方式对模型的所有参数都进行训练微调,由于现有的开源模型参数量都十分巨大,如最新千问72B模型(qwen/Qwen1.5-72B-Chat)有720亿参数,对所有的参数都进行处理,那GPU资源成本会非常高,可能高达数百万每年,为了解决这个问题,社区提出了大模型微调的概念:PEFT (Parameter-Efficient Fine-Tuning),即对

#搜索引擎
大模型驱动SPU

本文围绕SPU(标准化产品单元)的演进与挑战,系统分析了当前SPU在定义、生产、审核和数据治理方面存在的核心问题,如SPU定义与商品类目强耦合、数据质量不及预期、审核效率仍有提升空间、存在同质化数据等。为应对这些问题,文章重点介绍了通过引入AI/大模型技术,在SPU生产、审核与治理链路中的实践成果,包括算法生成SPU、机审辅助、外包审核流程优化及数据质量提升,并推动了商品托管等应用场景落地。针对产

#大数据
一位淘宝工程同学的大模型LoRA微调尝试

通过AI驱动的精准推荐、场景化表达与动态策略调控,我们为用户创造更自然、更智能的购物旅程,为营销业务提供高效、敏捷的技术支撑,助力淘宝构建以用户为中心的全域营销技术体系。结果表明,LoRA 能以极低的计算成本让通用大模型有效学习业务知识,显著提升其在特定任务中的表现,真正实现“让大模型懂业务”,推动 AI 从“可用”走向“好用”。从智能客服到内容生成,从代码辅助到推荐系统,大模型正以前所未有的速度

#人工智能
    共 171 条
  • 1
  • 2
  • 3
  • 18
  • 请选择