2025年的云栖大会,无疑是观察中国乃至全球AI技术走向的一个关键窗口。阿里巴巴的两位核心人物——一位是主导技术产品发布的阿里云高管,另一位是集团CEO吴泳铭——分别从“当下”和“未来”两个维度,为我们描绘了一幅宏大而清晰的AI蓝图。前者详尽展示了阿里云全栈AI技术的“肌肉群”,从模型、平台到基础设施,可谓“应有尽有”;后者则站在更高维度,阐述了通往超级人工智能(ASI)的路径与阿里巴巴的战略抉择。

将这两场演讲结合解读,我们看到的不仅是产品的发布,更是一个战略与执行完美闭环的雄心:以全栈技术实力为基石,支撑起通往超级智能的远征。

第一篇章:技术基石与全栈布局——AI实力大阅兵

阿里云的演讲首先明确了一个核心观点:大模型与云计算的结合已成为行业趋势和技术创新的重要驱动力。基于此,阿里云展示了其在模型层、开发层和基础设施层的全栈创新成果,构成了一套完整的“AI作战体系”。

1. 模型层:通义家族的全面进化

作为核心能力,通义大模型家族迎来了“史诗级”更新,展现了其在全球范围内的领先水平。

  • 通义千问 (Qwen):
    • 旗舰升级: 发布了总参数超过万亿规模的旗舰版模型MAX,在指令遵循、复杂任务解决,特别是Coding Agent方面有大幅提升。其预览版在全球大模型榜单上已并列第三,正式版能力还将进一步提升。
    • 多模态突破: 视觉语言模型VO具备了强大的万物识别和复杂空间理解能力,支持高达256K的上下文窗口,可理解长达两小时的视频。多模态大语言模型Omni则集成了文本、图像、音视频处理与语音生成能力,将以往需要多个模型级联完成的复杂任务合而为一,极大降低了延迟。
    • 代码与架构创新: Coder模型与开发工具深度联合训练,提升了实际任务效果和代码安全性。同时,发布了探索下一代模型架构的N版本,通过混合注意力机制、高稀疏度结构等创新,在实现模型性能的同时,推理吞吐量提升十倍。
  • 通义万象 (Wanxiang):
    • 原生音视频生成: 全新的2.5预览版采用原生多模态生成架构,可一次性生成音画同步的视频,包括人物对话和背景音,并能生成长达10秒的1080P高清视频。
    • 数字人能力: 提供了从创造(语言描述或图片复刻)、克隆(5秒音视频即可克隆声音与神态)到驱动(动作与语音驱动)的全链路数字人解决方案。
  • 新成员通灵 (Tongling): 专注于语音生成领域,整合了语音识别(ASR)和语音合成(TTS)的能力,打造了全新的品牌系列。

深度洞察: 阿里云的模型策略体现了“广度”与“深度”并举。广度上,实现了从语言、代码到视觉、语音的全模态覆盖,并积极拥抱开源,通义千问的衍生模型数量已位居全球第一,下载量突破6亿次,构建了庞大的开发者生态。深度上,则在旗舰模型性能、多模态融合以及下一代架构上不断探索,追求技术上的绝对领先。

2. 开发层:Agent智能体——AI时代的新范式

模型能力再强,也需要有效的开发范式来释放其价值。阿里云认为,基于Agent(智能体)的开发是AI时代的重要范式。智能体开发的核心是解决四大难题:

  • 规划与决策: 从简单的流程编排,进化到让模型智能地分解、规划和执行复杂任务。
  • 记忆管理: 建立贯通上下文的动态、个性化、多模态记忆体系,从具体记录中抽象出模式和经验。
  • 信息增强: 通过连接本地知识、领域知识和实时信息,拓展模型的能力边界,确保准确性与专业性。
  • 工具调用 (Action): 让模型通过调用各类工具与真实世界交互,并从反馈中学习进化。

为此,阿里云推出了百炼Agent平台,提供从低代码拖拽到基于AgentScope语言的专业开发SDK,并内置了RAG、Deep Research等多种Agent,全面支持智能体的开发、调试、部署与进化。

3. 基础设施层:坚不可摧的AI算力底座

所有上层应用都离不开强大的AI基础设施。阿里云展示了其软硬件一体化的自研技术体系:

  • 硬件层面: 从支持高密度芯片的盘古超级计算节点服务器,到支持数十万卡规模集群的HPN 8.0高性能网络,再到为AI训练优化的CPFS高性能存储
  • 平台层面: 灵骏智算集群提供高稳定性和异构算力支持,容器与函数计算为Agent的工具调用提供极致弹性,PAI人工智能平台则为模型训练、推理和强化学习全链路加速。
  • 安全保障: 提供从模型训练数据安全到模型服务内容合规的全链路AI安全产品。
第二篇章:远征星辰大海——通往ASI的宏大叙事

如果说技术发布会是“术”的展示,那么CEO吴泳铭的演讲则是“道”的阐述。他提出了一个极具前瞻性的判断:一场由人工智能驱动的智能化革命刚刚开始,其终点并非AGI(通用人工智能),而是将超越人类智能、能够自我迭代进化的ASI(超级人工智能)

吴泳铭描绘了通往ASI之路的三个关键阶段:

  1. 第一阶段:智能涌现(学习人)
    • 特征: 这是我们已经经历的阶段。大模型通过学习互联网上人类积累的所有数字化知识(文本、书籍等),涌现出通用的对话和初步的推理能力。
  2. 第二阶段:自主行动(辅助人)
    • 特征: 这是我们正迈入的阶段。AI不再局限于语言交流,而是开始使用工具(ToolUse),与数字世界和物理世界交互,辅助人类完成真实世界的任务。此阶段的关键是大模型Coding能力的提升,因为理论上只要AI能自主编程,就能解决无限复杂的问题。
  3. 第三阶段:自我迭代(超越人)
    • 特征: 这是通往ASI的决定性阶段,有两个关键要素:
      • 连接物理世界的原始数据: AI必须超越学习“人类归纳总结后的知识”,转而直接从物理世界获取全面、原始的数据进行学习。正如自动驾驶需要原始摄像头数据而非仅仅是驾驶规则。
      • 自我学习(Self-learning): AI将有能力为自身的升级去搭建训练架构、优化数据流程,从而实现自我迭代和智能升级。

深度洞察: 这个三阶段理论不仅是一个预测,更是阿里巴巴AI战略的顶层设计。它解释了为什么阿里云当前如此重视Agent和工具调用——因为这是实现第二阶段“自主行动”的核心,更是迈向第三阶段,让AI连接真实世界、获取原始数据的唯一通路

深度分析:战略与执行的完美闭环

将两场演讲并置,我们可以清晰地看到阿里巴巴AI战略的几个核心支点,以及其战略与执行的高度协同:

  1. “大模型是下一代操作系统” vs. “百炼Agent平台”
    • 吴泳铭提出,大模型是下一代的操作系统,自然语言是编程语言,Agent是新软件。这在技术演讲中得到了完美印证——百炼Agent平台正是这个“操作系统”的具体实现,它为开发者提供了创建和运行“新软件”(Agent)所需的一切环境和工具。
  2. “打造AI时代的安卓系统” vs. “通义千问的开源生态”
    • 吴泳铭明确了通义千问的战略选择——走开源路线,打造AI时代的安卓系统。技术演讲中的数据——全球第一的衍生模型数量和超6亿的下载量——表明这一战略已初见成效。通过开放,阿里旨在构建一个最繁荣的开发者生态,让通义模型渗透到所有计算设备中。
  3. “超级AI是下一代计算机” vs. “全栈AI基础设施”
    • 吴泳铭将未来的AI算力体系定义为**“超级AI计算机”,将Token(通证)比作未来的“电”。这台“计算机”的构建蓝图,就在技术演讲中对盘古服务器、HPN网络、灵骏集群等全栈基础设施的详细介绍里。吴泳铭宣布的3800亿AI基建投资以及未来能耗规模提升10倍的规划**,则为这台超级计算机的建设注入了最坚定的承诺。
结语

2025云栖大会向我们展示了阿里巴巴一个清晰且逻辑自洽的AI发展闭环:

  • 愿景(Vision): 迈向能够自我迭代、超越人类的ASI超级智能。
  • 路径(Path): 遵循“智能涌现 -> 自主行动 -> 自我迭代”的三阶段路线图。
  • 战略(Strategy): 将大模型定位为“操作系统”,通过开源构建“安卓生态”,将整体AI能力打包成“超级计算机”对外服务。
  • 执行(Execution): 以通义模型家族为核心引擎,以百炼Agent平台为开发中枢,以自研的全栈AI基础设施为坚实底座,一步一个脚印地将战略落地。

从琳琅满目的技术产品,到高屋建瓴的未来判断,阿里巴巴正在用行动证明,它不仅是这场智能化革命的积极参与者,更立志成为定义未来、驱动变革的核心力量。这场通往星辰大海的远征,已经扬帆起航。


2025云栖大会-阿里云发布七款大模型技术产品

2025云栖大会-阿里巴巴CEO吴泳铭演讲完整版

Logo

更多推荐