图片

作者 | 唐小引

出品 | CSDN(ID:CSDNnews)

6 月 5 日上午,北京国家会议中心的会场里,过道站满了人。

这是 2026 腾讯云 AI 产业应用大会的主会场,原本能容纳上千人的空间此刻显得局促。坐在我后排的一位嘉宾举着手机拍几张照片,但很快放弃了——台上的人被密密麻麻的人头挡得严严实实。“我老婆让我拍姚顺雨,但我压根看不到。”他自嘲地说道。而会场外,还有很多人根本进不来。

这场爆满的对谈,主角是腾讯集团高级执行副总裁、云与智能产业事业群 CEO 汤道生,和腾讯首席 AI 科学家、腾讯混元大语言模型及 AI Infra 负责人姚顺雨。对谈主题是《腾讯 AI 下半场》,他们互相提问、互相回答。

图片

这是姚顺雨加入腾讯后的第二次公开亮相,也是他首次线下真身出现在公众面前。自从这位 ReAct 架构的提出者、曾参与 OpenAI Operator 和 Deep Research 开发的明星 AI 科学家宣布加盟腾讯以来,外界对他的好奇从未停止:他为什么选择腾讯?他在腾讯做了什么?更重要的是,他能否帮助腾讯在这场 AI 竞赛中扳回一城?

而汤道生在对谈最后抛出的那个问题,更是直击外界最关心的话题:“很多自媒体都会提到,腾讯在 AI 上没有及时抓住一些机会。你觉得我们是走得慢了吗?”

图片

为什么是腾讯?一个 AI 科学家的三个理由

对谈开场不久,汤道生就直奔主题:“你加入腾讯之前,我记得我还问过你几个问题。为什么会选择来到腾讯?而且你认为 AI 的下半场最重要的是什么?”

姚顺雨的回答,从一个概念的澄清开始。

“我想先解释一下什么叫做下半场,因为我自己感觉这个词有点被滥用了。”他说,“这个概念其实我去年在一个博客里面提出来的。”

在姚顺雨看来,AI 的“上半场”是一个寻找好方法的时代——你为下围棋做一个程序,为翻译做一个模型,每个任务都需要专门的解决方案。但过去两年,随着大模型的出现,情况发生了根本性变化:“我们像有了一个锤子,它可以去打任何钉子,它是一个通用的方法来解决特别多样的问题。那么反而更困难的是怎么寻找好问题。”

这个判断,直接指向了他选择腾讯的第一个理由:这里有很多好问题,有很多好产品。

图片

“好的产品能够解决第一个问题,就是我们做了这样的技术,到底要把它用在什么地方产生价值。”姚顺雨说。但更重要的是第二点——环境和上下文(context)。“如果没有好环境,Agent 没办法去协作。比如说如果你没有一个点外卖的 API,那你即使想点外卖也没办法。”

他认为,在 AI 的下半场,context 变得越来越重要:“模型未来是把一个非常复杂的输入变成一个输出。那很多时候,你有没有这个最原始的输入?你知不知道这个人他到底在干什么?你知不知道这个企业的各种各样的信息?这一点的话,我觉得腾讯有非常强的优势。”

腾讯拥有微信、QQ、腾讯会议、腾讯文档等一系列高频产品,这些产品每天产生海量的交互数据,构成了丰富的上下文环境。对于一个想要让 AI 真正落地、真正产生价值的科学家来说,这样的场景优势是其他地方难以比拟的。

但姚顺雨强调,第二个理由其实不是最重要的。最重要的理由是文化。

“我还记得我第一次跟你聊天的时候,包括和很多其他老板聊天的时候,我第一印象是大家都非常的诚实。”姚顺雨看着汤道生说,“大家做得好、做得不好都非常实在,大家不会去掩盖。我知道我这里做好了,我知道我这里没做好,我知道这里应该怎么做。我觉得这个坦诚是我的第一印象。”

他接着说:“第二点就是腾讯总体是一个极其 trust-based、非常信任的机制。我觉得这一点对于做 AI 也是非常重要的。包括我觉得我们的文化有一个非常 low ego、非常 solid 的技术面。这些文化都是对于长期做一个 AI 组织非常重要的,包括我们长期主义的坚持。”

这段话说得很实在。在 AI 这个快速变化、充满不确定性的领域,一个组织的文化底色往往比短期的资源投入更重要。坦诚意味着能够正视问题,信任意味着能够给予科学家足够的空间,长期主义意味着不会因为短期的波动而改变方向。

姚顺雨给出了他对 AI 下半场的定义:“我个人的目标,我觉得就是要在中国建立一个长期的、极具 AI 价值的这样一个组织。”

他认为,今天的 AI 主要是三个部分:首先是 foundation(基础)部分,怎么把预训练和后训练这些技术做得非常 solid;第二是产品,怎么把这样的基础真正为用户产生价值;第三是 frontier(前沿探索),怎么去探索新的研究范式,探索新的机会。“我觉得最重要的是说,我们要构建一个非常均衡的三角形这样的组织。”

图片

Co-design:模型与产品如何真正结合?

如果说姚顺雨的回答解释了“为什么来”,那么汤道生接下来的问题则直指“来了之后做什么”。

“你刚才提到了模型跟产品,产品可以提供环境,里面有上下文。那我想问你,一直我们一起开会常提的,有一个词就叫 co-design。”汤道生说,“怎么把产品跟模型能够比较紧密地结合起来?”

Co-design(协同设计),这是腾讯 AI 战略中的一个核心概念。在大模型时代,模型不再是一个孤立的技术组件,而是需要与产品、场景深度融合。但这种融合具体怎么做?

姚顺雨给出了三点思考。

第一,co-design 的前提是模型本身要做得很 solid。“首先预训练是一个相对产品无关(product-agnostic)的事情。它做得非常 solid,可以提供一个非常强的 foundation。而且预训练最大的特点就是它是可扩展化地解决问题,它的进步大概率在各种各样下游的任务都可以有一个提升。”

这意味着,模型能力的提升是一切的基础。没有一个强大的基座模型,再好的产品设计也是空中楼阁。

第二,后训练要量体裁衣。“实用的价值是大于很多 benchmark 排名的价值。”姚顺雨说。这一点尤其重要——在 AI 领域,很多公司热衷于在各种 benchmark 上刷榜,但真正的用户价值往往与榜单排名并不完全一致。“我们跟各种各样的产品进行了深度的 co-design。我觉得 co-design 很关键的一点就是要产生闭环。我们做了大量的工作去把产品的输出做回流。”

这里透露出一个重要信息:腾讯正在建立从产品到模型的数据回流机制。用户在产品中的真实使用数据,会反馈到模型的训练中,形成一个持续优化的循环。

第三,LLM 时代和过去 AI 最大的区别是能力的复合性。“在 LLM 之前,比如说你做一个翻译的产品,你只要把翻译做好了就行了。你做一个围棋的程序,你只要把围棋做好了就行了。”姚顺雨说,“但今天即使你想做一个 Coding Agent,你发现其实需要的能力是 open-ended 的。你需要非常好的上下文、大长度的处理能力,你需要非常强的 reasoning 能力、planning 能力。它其实是一个非常复合的能力集。”

这意味着,单点的模型优化已经不够了,需要全面的能力提升。而这种全面性,恰恰需要多个产品场景的数据来支撑。

姚顺雨举了元宝(腾讯的 AI 助手产品)的例子:“我们跟元宝的 co-design,因为模型有很强的多轮交互和推理能力,这样的能力可以迁移到 AI 搜索或者其他产品。所以这些产品能够反哺模型的数据,在这些数据上训练都可以提升其他能力,形成一个网络效应。”

这是一个很有意思的逻辑:不是为每个产品训练一个专门的模型,而是让一个通用的强大模型在多个产品场景中学习,产品之间形成能力的相互增强。

汤道生补充了一个细节:“我们在讲元宝的时候,还提到做了测试集的问题。产品里面大家使用的能力,跟 benchmark 好像有蛮大的差异。”

这句话点出了一个行业痛点:很多模型在标准测试集上表现很好,但在真实产品场景中却不尽如人意。腾讯的做法是,基于真实产品场景构建自己的测试集,用真实的用户需求来评估模型。

图片

从 ReAct 到 Agent:一个博士论文的预言

对谈进行到中段,汤道生抛出了一个学术性的问题:“你是 ReAct 架构的提出者,博士研究也是围绕 Agent 智能体展开的。你几年前的一些观点到今天兑现了吗?”

姚顺雨的回答,带着一种时空交错的感慨。

“那段时间我还是挺感慨的,因为我重新读了这篇博士论文,我感觉回到了一个很远古的时代。”他说,“我的博士论文的标题叫做‘Language Agents: From Next-Token Prediction to Digital Automation’,那是2019年,7年前。”

2019年,那是 GPT-2的时代。“它当时只能做 next token prediction,而且它产生的一段话可能连续会有很多问题。所以我当时没有想象到它能够有一天成为改变世界的技术。”

但即使在那个时候,姚顺雨的想象力已经超越了当时的技术现实。“当时我的想象力可能比较荒谬吧。我觉得这个世界非常 complex,世界不仅仅是个 open system,它其实是个非常 dynamic system。我觉得它有一天的潜能不仅仅是做 text,它其实在于把这个世界上所有的事情做 automation。当时我想的是 digital automation,但现在看起来也有可能是 physical automation。”

这个判断在今天看来几乎是预言性的。从 ChatGPT 到 Claude,从 Operator 到各种 Agent 产品,AI 正在从文本理解走向任务自动化。

姚顺雨回忆起 ReAct 诞生的那个时刻:“我还记得2022年7月的时候,有一天晚上我跑了几次,把 prompts 写好,把当时的模型和一个手写的 Wikipedia API 连在一起,然后它第一次可以检索网页和回答问题,并且可以多轮交互。”

“那种感觉就像威廉·吉布森说的那个感觉一样——我感觉这个未来已经来了,只是还没有被 fully distributed。”他说,“所以我当时就给导师发了第一份报告,也就是真正把互联网连在一起而且能做到 long reasoning。我当时感觉未来5年或10年可能改变世界。但可能我没想到会这么快。”

他的博士论文做了两部分工作:第一部分是如何建立一个 Agent 方法论,如何把一个 next token prediction 的机器变成一个 Agent,变成一个自动化的机器,最重要的工作可能就是 ReAct;第二部分是怎么去定义 digital automation benchmark,比如 WebShop(第一个互联网购物任务)和 SWE-bench(第一个 Coding Agent 任务)。

“现在看起来,Agent 最重要的两条可能确实是 Web Agent 和 Coding Agent。”姚顺雨说。

更有意思的是,他翻出了博士论文结尾写的 future work:“第一个是 train models for Agent,第二个是 shift and robust deployment,第三个是 scientific discovery,第四个是怎么样去 help human。我觉得很感慨,我说我现在其实在做我当年的 future work。很多时候觉得这个行业正在朝着这些方向走。那些当时挺小众的想法,现在大家都在做。技术的发展往往超出我们的预期。”

图片

Coding Agent:下一代模型的核心能力

汤道生接着问:“大家都说 Agent 需要消耗很多 token 去调用。这对于腾讯做下一代模型的研发,你觉得什么是侧重,有哪些地方比较挑战?”

姚顺雨的回答很明确:“毫无疑问,今天 Agent 或者 Coding Agent 有点像预训练一样,是不得不做的事情,是最基础能力。我个人觉得 Coding Agent 非常本质,还有一个重要原因就是说它有点像图灵完备的事情,当你有能力去控制自己的 file system,当你有一个 container 的时候,其实你是一个 complete 这样一个 system。”

但他强调,腾讯的打法会有几个区别:

第一,即使大家都说 Coding Agent 最重要,但还是要强调体系的全面化。“真的要把 coding 做好,其实需要远不止 Coding Agent 这一点。你需要把推理做得非常好,因为你需要各种各样的能力。大模型重要的一点是泛化性。”

这是一个重要的洞察。很多公司在追逐 Coding Agent 的时候,可能只关注代码生成能力,但实际上,要做好一个真正有用的 Coding Agent,需要理解需求、规划架构、调试错误、优化性能等一系列能力,这些都依赖于模型的综合能力。

第二,产品的 co-design 越来越重要。“如何好好利用线上的回流,我觉得是每一个模型团队都在应对和思考的问题。这里我觉得我们的 co-design 经验逐渐发挥作用。”

第三,还需要很多探索能力。“无论是技术的演进还是产品的演进还是应用,我觉得我们还是需要做一些探索性的、不确定的工作。”

这三点加在一起,勾勒出腾讯 AI 的一个整体图景:不是单点突破,而是系统性建设;不是闭门造车,而是产品驱动;不是保守跟随,而是保持探索。

图片

性价比的真相:不只是模型架构

对谈进入下半场,话题转向了一个更实际的问题:成本。

“因为大家越来越多有 token 焦虑,成本的压力是爆发式增长。”汤道生说,“我也听到很多客户、甚至用户、同事们在盯紧计费的消耗。怎么可以让我们的模型在解决某个问题或者完成某个任务时,token 效率最高?”

姚顺雨的回答打破了一个常见的误区。

“其实我觉得在中国讨论性价比,更多讨论的是模型架构。但其实它是一个很复杂的体系。”他说,“我觉得最重要的首先是你的 performance。很多人跟我说,他最后发现用 OPUS 这样的模型比用更差的模型更省钱,因为更快地把这个事情做对了,也省得人的精力。最重要的事情是 performance,如果你的 performance 好,性价比是最关键的事情。”

这个观点很重要:性价比的核心不是模型架构的创新,而是性能本身。如果性能不好,性价比无从谈起。

“尤其我觉得今年,可能很多简单任务的 robustness 会变得更加重要,一次把相对简单任务做对,这可能是性价比更关键的部分,不仅是模型架构。”姚顺雨说。

他进一步解释:“第二部分就是成本它本身,性价比第一是性能,如果性能不好性价比无从谈起。第二点是成本,中国是领先于世界的,我们做大量工作优化我们的成本。成本可能最重要的事情是怎么用一个更小的模型把更高的价值任务做好,在这基础上架构创新,包括长文管理、脚手架有很多需要做的事情。如果我们做一个相对较小的模型,但是它比肩大模型性能,而且在大部分任务上做很强的 robustness,这可能在很多长尾任务上面提升一两个点,可能在今天的中国更有价值。”

这段话透露出几个信息:

1. 腾讯在工程优化上投入很大,这是中国公司的优势;

2. 但更重要的是模型本身的效率,用更小的模型实现更好的效果;

3. 在中国市场,长尾任务的 robustness(稳定性)比极端场景的突破更有商业价值。

这是一个务实的判断。对于大多数企业客户来说,他们需要的不是一个在某个 benchmark 上刷榜的模型,而是一个在各种实际任务中都能稳定工作、成本可控的模型。

图片

Agent 的产品化:场景、Context 和 Skills

姚顺雨反过来问了汤道生一个问题:“你觉得 Agent 什么时候会产生一个颠覆性的产品机会?以及你现在认为什么是第一个好用的 Agent?”

汤道生的回答很产品化:“我们做的 Agent 针对不同场景其实有不同的产品形态。在 Agent 的设计上面其实大同小异,都是要发挥好模型的能力。哪怕模型在迭代、它能力越强,可能 Agent 需要做的工作也越来越少。”

他分享了一个观察:“我看我们好几个产品在过去这段时间,确实是随着模型能力加强,我们把产品做得更简化了,更多的是给模型提供更多的 context,创造更多的 skills,让模型能够更高效地去完成任务。”

图片

这是一个重要的产品哲学转变:在 AI 时代,产品经理的工作不再是设计每一个功能细节,而是为模型提供好的上下文和工具,让模型自己去理解用户需求、调用工具、完成任务。

“在不同赛道里面其实都可以针对每一个场景提供有用的信息、提供 context。”汤道生说,“在 coding 的环境里面用相关的 context 给到模型;在 Workbuddy 里面做协作、做 PPT,可能大家关注的内容或者 context 也有些不一样。所以我觉得在做不同的 Agent,更重要的还是了解那个场景下什么内容、什么信息是重要的、比较 relevant 的,能够跟模型配合好,让模型能够有它需要的信息,同时发挥它的推理能力。”

这段话看似平淡,实际上揭示了腾讯做 AI 产品的一个核心逻辑:不是让模型适应产品,而是让产品为模型提供好的环境。模型是通用的,但每个场景需要的 context 和 skills 是不同的,产品的价值就在于把这些场景特有的信息和能力提供给模型。

图片

组织的演进:小团队与大平台

对谈接近尾声,姚顺雨问了一个关于组织的问题:“最近我们确实看到一些小团队在快速迭代产品。我挺好奇,相对于我们在这种新的 AI 时代的研发组织管理上有什么变化?”

汤道生的回答很坦诚:“前几年大厂里面有非常多的赛道、不同的组织在不同领域做探索。但我也发现最近几年,大家可能在快速组建一些小团队在某些点去实验。我觉得这种敏捷的小团队是非常适合目前这个 AI 刚刚开始、很多应用可能都在找场景、在寻找 product-market fit 的阶段。”

但他强调,小团队也需要大平台的支撑:“这些小团队也需要大厂的一些基础能力来做支撑。比如像我前面提到的 Furnace(腾讯的 AI 基础设施体系),像这些评测、测试,这些比较前置的 AI 能力的保证。所以我们还要支持好这个 AI Infra 去做实验,让不同的小团队可以去探索、去验证,把质量保证的工作、alignment 这些做好。”

这是一个很平衡的组织观:既要有小团队的灵活性和创新性,又要有大平台的基础设施和能力支撑。这也是大公司在 AI 时代的一个优势——可以让多个小团队在同一个强大的基础设施上并行探索,降低试错成本,提高成功概率。

图片

腾讯 AI 慢了吗?一个直接的回应

对谈的最后,汤道生抛出了那个最尖锐的问题:“很多自媒体都会提到,腾讯在 AI 上面没有及时抓住一些机会。你觉得我们是走得慢了吗?到底下半场是什么?您能多说一下吗?”

姚顺雨的回答,是整场对谈中最重要的部分。

“我觉得首先 AI 其实今天有两个重要判断。”他说,“第一个就是说我们认为 AI 是一个短期的游戏还是长期游戏?在硅谷大家蔓延很多情绪,哎呀,2年后所有人都要失业,AI 要取代所有人的工作,我们要赶快赚2年钱退休。但很显然我们的判断 AI 是一个长期游戏,其实我觉得 AI 刚开始,下半场才刚刚开始,我不认为 ChatGPT 和 Claude Code 会是唯一的 super App,我觉得那是一个非常灰暗的世界,我觉得肯定会有源源不断新的机会诞生。可能今天就像是70年代 PC 刚刚产生的时候,我觉得还有很多很多事情需要做。”

这是第一个判断:AI 是长期游戏,下半场才刚刚开始。这意味着,短期的领先或落后并不决定最终的结果,重要的是能否持续投入、持续进化。

“第二个判断,它会是个更线性还是多元游戏?”姚顺雨继续说,“因为确实过去几年大家能看到的是 Pre-training、post training,然后 Agent,Coding Agent,似乎有一个非常清晰的主线,这个主线是所有人都在做一样的事情,都在 copy,这也是非常灰暗的事情。但到底未来变得更单一还是更多元?我个人看法会变得更多元,毫无疑问 Coding Agent 生产力会变得更加重要,我觉得它是刚刚开始的事情,这个世界还有很多空间没有被填满,多模态、具身智能,很多很多新的事情都在发生,或者刚刚发生,所以从这个角度来说,如果我们认为下半场刚刚开始,可能确实不是完了。”

这是第二个判断:未来会变得更多元,不是单一路径。不只是 Coding Agent 一条路,还有多模态、具身智能等诸多方向。

“过去模型、产品做了很多探索,走很多弯路,我觉得这是正常的,你如果没有做过一个事情,第一次做肯定有曲折。”他停顿了一下,“但是我觉得可能更重要的事情是能不能诚实面对自己,能不能 Be Real,能不能够去看到 feedback 然后去改变,能不能够保持耐心,这个事情是下半场最重要的事情。”

汤道生接过话题:“对,我觉得腾讯大家总是喜欢挑某一个点来批评,当然我觉得我们也欢迎大家给我们提出更高的要求,但我们还是有非常多业态,很多产品在很多赛道,同时也有很多的团队在推进不同的项目。”

他的语气很平静:“毫无疑问,在这样一个庞大的组织里面,有些地方可能我们做得快了,有些地方做得慢了,有些地方可能会做失败,在探索。所以我觉得这些提醒都非常好,我觉得确实有些地方是可以做得更好。”

然后他说出了那句关键的话:“就像你说的,这是一场长跑,腾讯还是有非常丰富的场景。所以我们在长跑中也请各位多给我们提醒,多给我们建议,也多用我们的产品,来给我们最真实的反馈。”

图片

结语:汤道生 X 姚顺雨对谈背后的战略清晰度

这场对话的重要性、含金量十足,我一直在想一个问题:这场对谈到底想传达什么?

表面上看,这是一场关于技术和产品的对话,两位高管分享了腾讯在 AI 领域的思考和实践。但如果仔细品味,会发现这场对谈其实是在回答外界对腾讯 AI 的三个核心质疑:

第一,腾讯有没有顶尖的 AI 人才?姚顺雨的出现本身就是答案。这位 ReAct 架构的提出者、前 OpenAI 研究员,不仅加入了腾讯,而且在对谈中展现出对技术、产品、组织的深刻理解。他不是一个被供起来的“吉祥物”,而是一个真正在一线工作、推动模型迭代、参与产品设计的科学家。

第二,腾讯有没有清晰的 AI 战略?整场对谈反复强调的几个关键词——co-design、context、长期主义——构成了腾讯 AI 战略的骨架。这不是一个追求短期刷榜、追逐热点的战略,而是一个基于场景、注重实用、强调持续迭代的战略。这个战略可能不够性感,但很务实。

第三,腾讯在 AI 上到底慢不慢?两位高管的回答很一致:AI 是马拉松,不是短跑。这不是一个回避问题的托词,而是一个战略定力的表达。在一个充满泡沫和焦虑的行业里,保持耐心、持续投入、专注于为用户创造价值,这本身就是一种竞争力。

更重要的是,这场对谈展现了一种难得的坦诚。汤道生没有回避外界的批评,姚顺雨也没有夸大腾讯的成就。他们承认有些地方做得不够好,承认走过弯路,承认还在探索。这种坦诚,恰恰是姚顺雨当初选择腾讯的理由之一。

【END】

Logo

加入「COC·上海城市开发者社区」,成就更好的自己!

更多推荐