出品 | CSDN(ID:CSDNnews)

北京时间 2026 年 3 月 17 日凌晨,圣何塞 SAP Center 里,黄仁勋穿着那件标志性的皮衣上台,几句开场白之后,这场 GTC 就直接进入了高密度模式。

和隔着直播看完全不是一回事。我们这次直击现场,CSDN 创始人兼董事长蒋涛、奇点智能研究院院长兼 CSDN 高级副总裁李建忠带队亲赴硅谷 GTC 2026 大会现场。为你带回关于全球 AI 计算和英伟达战略的系列现场报道和深度解读。 

现象最直观的感受不是“信息量很大”,而是黄仁勋对整场叙事节奏的控制:

CUDA 二十周年、Vera Rubin、光子互连、AI Factory、Agentic AI、NemoClaw、OpenClaw、数字孪生、Physical AI、雪宝走进现实……任何一个单拎出来都够做 headline。

在现场看这场演讲,会更容易意识到黄仁勋演讲的情绪带动能力。他其实并不是靠一次性抛出了多少新词,而是把这些东西讲成了一条完整的线:

从 GeForce 到 CUDA,从 CUDA 到深度学习,从深度学习到 Token 经济,从 Token 经济到 Agent,再从 Agent 走向机器人和物理世界。

老黄在这场演讲里,宣告了 SaaS 的死亡,揭幕了风云莫测的 Agent 时代。

AI 的下一阶段,不是更会聊天,而是开始真正干活。

CUDA 二十周年:那个“让 GPU 可编程”的赌注

黄仁勋这次没有一上来就报新品,而是先把时间拨回了 1999 年。

那一年,NVIDIA 做出了 GeForce 256,也就是后来被它定义为“世界上第一块 GPU”的产品。对普通用户来说,它改变的是 PC 游戏;但对黄仁勋来说,它更像是一个起点:GPU 天生适合处理那些可以被拆成海量小任务、并行执行的问题。

真正改变一切的,是 2006 年 CUDA 的发布。

从那一刻开始,GPU 不再只是用来渲染图形的显卡,而变成了一台可以被程序员直接调用的通用并行计算机器。开发者不需要再把自己的数据伪装成图形纹理,也不需要再绕着图形管线写各种技巧,终于可以正大光明地在 GPU 上写程序。

这件事的影响,远远超过了一代芯片升级。

分子动力学、流体模拟、地震处理、金融建模,这些原本就高度适合并行化的问题,一下子找到了真正匹配它们的底层平台。更重要的是,NVIDIA 没有把 CUDA 只做成一个接口,而是围绕它慢慢长出了一整个软件生态:cuBLAS、cuFFT、cuDNN、TensorRT……不同领域的人不需要从零掌握 GPU 编程,也能借助这些库,把自己的应用真正跑起来。

这就是黄仁勋反复讲的——CUDA 飞轮。

更多库,带来更多开发者;更多开发者,带来更多应用;更多应用,推动更多 GPU 部署;更多部署,再反过来支持更多研发。

二十年转下来,CUDA 已经不只是一个工具链,而像是加速计算时代的一套底层操作系统。

NVIDIA 最深的护城河并不是某块芯片,而是 CUDA 构筑的软件生态。

说得更直白一点:芯片可以追,参数可以抄,但二十年积累下来的开发生态、库、工作流和开发者习惯,不是说追就能追上的。

如果你也在关注 AI 计算、Agent 以及 NVIDIA 路线图,欢迎扫码加入 GTC  2026 交流群,查看大会直播视频回放!

Geoffrey Hinton 赌对了,NVIDIA 也赌对了

讲完 CUDA,黄仁勋把时间线拉到了 2012 年。

那一年,Alex Krizhevsky、Ilya Sutskever 和 Geoffrey Hinton 用两块 NVIDIA GTX 580 训练出 AlexNet,横扫 ImageNet。现代深度学习时代,就是从那一刻真正开始加速的。

这段历史今天看起来像常识,但在当年并不是。学术界对神经网络长期充满怀疑,真正一路坚持下来的人并不多,Geoffrey Hinton 就是其中最关键的一个。

黄仁勋提到,Hinton 当年押的是一个看似朴素、但当时并不主流的判断:只要数据足够多,算力足够大,神经网络就会不断变强。后来的历史证明,他赌赢了。

而 NVIDIA 押的是另一件事:如果深度学习成立,那 GPU 就会成为它最重要的底座。

事实也确实如此。

AlexNet 之后,NVIDIA 做出了 cuDNN,后来几乎所有主流深度学习框架都绕不开它。再往后,从 AlexNet 的 6000 万参数,到 GPT-3 的 1750 亿,再到今天万亿级别的模型,模型在变,框架在变,但那套“更多算力、更多数据、更大模型”的逻辑一直没变。

NVIDIA 不是在 ChatGPT 时代突然变重要,它只是提前二十年把路修好了。

而对于这其中的核心——数据,黄仁勋的判断是,企业里的两类数据,其实扮演着完全不同、但同样关键的角色:

● 结构化数据,是 AI 的基本事实

● 非结构化数据,是 AI 的上下文

数据库、表格、交易记录、库存数据,这些结构化信息是企业过去几十年最稳定、最可靠的资产。AI 真正补上的,不是把这些东西替代掉,而是让机器终于有能力去理解围绕它们的那些非结构化信息——文档、邮件、图片、合同、对话、代码、视频。

所以结构化数据和 AI 不是对立关系,恰恰相反,AI 会让结构化数据更值钱。

结构化数据像骨架,非结构化数据像血肉,而 AI 像是把这一切串起来的大脑。三者不是替代关系,而是组合关系。

这对企业来说是个很重要的判断:过去二十年积累下来的信息资产不会因为 AI 到来而失效,反而会因为新一代模型的理解能力变得更有价值。

AI 的真正爆发点,不再是训练,而是推理

接下来,黄仁勋把叙事重心从“过去二十年”切到“未来五年”。

这里有一个非常关键的判断:

AI 的重心,正在从训练转向推理。

而且,他没有只从技术角度讲这件事,而是给了一个很有冲击力的视角:Token Economics。

AI 经济的基本单位就是 Token。用户输入的是 Token,模型处理的是 Token,最后输出的也是 Token。于是 AI 的成本、收入、吞吐量,最后都落到同一个问题上:能以多快的速度、用多高的效率,生产出多少 Token。

这里最关键的变量,是 Token 消耗量正在急剧膨胀。

从 ChatGPT 到 o1,再到 Claude Code,单个任务的 Token 消耗已经不是翻倍,而是直接增长了四个数量级。

原因也很简单:过去那种一问一答的聊天式 AI,只是最轻量的一层。真正的 Agentic AI,一次任务里会不断思考、拆解、试错、调用工具、执行子任务,它消耗的 Token 规模和传统对话完全不是一个量级。

这也是为什么黄仁勋会反复强调一个说法:未来的数据中心,不再只是存储和检索数据的地方,而是生产 Token 的工厂。

也就是他这几年一直在推的概念:AI Factory。

黄仁勋真正要卖的是 Vera Rubin+ LPX

讲到这里,黄仁勋才正式把话题带进这次 GTC 的硬件主菜。

他先给 Blackwell 下了一个非常重的定义:它不只是 NVIDIA 历史上最成功的产品发布,甚至可能是整个计算产业史上最成功的一次发布。

这句话听起来很狂,但放在今天 AI 基础设施的供需关系里,也并不完全夸张。Blackwell 已经全面量产,几乎所有主要云厂商和 AI 公司都在围绕它部署。

但这场 GTC 当然不是一场庆功会。

Blackwell 再成功,也只是承前启后的一代。真正要接住 Agentic AI 这波需求爆炸的,是下一代架构:Vera Rubin。

这次黄仁勋又拿出了去年那张性能曲线图,甚至还顺手调侃了一下——大概只有 NVIDIA 的 Keynote,才会把去年的图再拿出来讲一遍。

但重点并不是复读,而是把问题讲得更清楚了:

未来 AI 推理不能只看“模型能不能跑”,而要看“以什么成本、以什么交互速度跑”。

图的纵轴,本质上是在看单位电力能产出多少 Token;横轴,本质上是在看每个用户能以多快速度拿到结果。

如果把这两个指标放在一起看,就会明白黄仁勋真正要表达的事:AI 服务会像云服务一样分层,从免费,到中档,到高端,再到超高端。模型越大、上下文越长、交互越快,底层硬件代际差异就越致命。

Rubin 的价值,不只是把 benchmark 做高,而是让那些原本“算不过来、也赚不过来”的高端推理服务,真正变成一门商业上可成立的生意。

如果说 Vera Rubin 是下一代引擎,那么 LPX 才是这部分真正的杀招。

黄仁勋给出的名字是 Groq 3 LPX。

不管外界之后怎么进一步解读这个命名,在 Keynote 的语境里,它最重要的意义只有一个:NVIDIA 正在把大规模 AI 系统的芯片互连,从铜推向光。

这件事为什么重要?

因为当系统规模做到 NVL72 这种级别之后,瓶颈早就不只是单块 GPU 的算力,而是整个系统内部到底能不能高速、低功耗、长距离地通信。铜线当然可以继续用,但功耗、热量、距离,都会越来越快地碰到边界。光子互连打开的,恰恰是更大规模 AI 系统的上限。

黄仁勋最擅长做的一件事,就是把一个底层技术变化,直接翻译成商业结果。

加上 LPX 之后,在高价值的 Premium 场景里,Vera Rubin + LPX 相比 Blackwell,性能效率可以拉到 35 倍。

而同样是一吉瓦电力,Blackwell 时代大概能对应数百亿美元量级的年度收入,而到了 Vera Rubin + LPX 这一代,这个数字被直接拉到了 3000 亿美元。

这当然有黄仁勋一贯擅长的放大表达,但它背后的逻辑并不复杂:

● 交互速度更高

● 上下文更长

● Agent 工作流更复杂

● 高客单价 AI 服务终于跑得动

● 单位电力产出的商业价值被成倍放大

最后落到一句最朴素的话上:

能效就是钱。

NVIDIA 现在连路线图都开始像软件公司了

接下来是 roadmap。这是惯例,画完今年的饼,就会画下一年的饼,确保订单量源源不断。

但这次路线图真正值得关注的,不是单纯“2025 是谁、2026 是谁、2027 是谁”,而是黄仁勋传递出来的节奏感:

NVIDIA 现在是按“一年一代”的速度在往前推。

● 2025:Blackwell

● 2026:Vera Rubin

● 2027:Vera Rubin Ultra

● 2028:Feynman

如果熟悉半导体行业,就会知道这有多凶。传统意义上的大架构切换,并不是这个速度。黄仁勋等于是在向所有云厂商、AI 公司和资本市场发信号:

别再用传统芯片周期去理解 NVIDIA 了。未来几年,它会像软件公司迭代版本一样,持续往前压硬件路线图。

这也是为什么今天越来越多的云厂、国家级算力项目和资本支出计划,都得围着 NVIDIA 的路线图转。数据中心设计、供电散热、网络拓扑、采购节奏,最后都会被这条 roadmap 牵引。

“历史上最大规模的基础设施建设,已经开始了。”

这也是整场演讲里最值得记住的一句话之一。

因为它不是在形容 NVIDIA 自己,而是在定义这个时代的背景:未来五年,全球会用一种接近修电网、铺铁路、建通信网络的方式,去建设 AI 基础设施。

黄仁勋点了很多名字:微软、AWS、Google、Meta、Oracle、CoreWeave、xAI,也提到了多个国家和地区。重点不在名单本身,而在于一个信号:

AI 算力正在从企业采购行为,升级成国家级战略资产配置。

这意味着 AI Factory 不再只是几个互联网巨头的事,而会像过去的发电站、铁路、港口、光纤网络一样,成为下一轮全球竞争的底层基础设施。

这也是为什么,黄仁勋可以顺理成章地把叙事从 AI 工厂接到数字孪生和 Physical AI。因为当基础设施已经按照“国家工程”的量级在建设,NVIDIA 当然不会满足于只做其中一层芯片。

企业软件将迎来从 SaaS 到 Agent-as-a-Service 的范式转换

如果说前半场黄仁勋在铺垫基础设施,那么后半场真正的主角只有一个:Agentic AI。

这里有一个很重要的区分:Agent 不是更会聊天的大模型,也不是把 prompt 写长一点的 ChatGPT。它是一套能感知环境、调用记忆、读取文件、使用工具、拆解任务、调度子 Agent,最后自己把事情做完的系统。

Agent 不再只是回答问题,它开始处理任务。它不只是对话入口,而越来越像一个调度中心。多模态输入进来,记忆、文件、外部工具、命令行、MCP 接口、子 Agent 全部围着它转。

所以黄仁勋这次给出了一个非常浓缩、也很适合传播的判断:

Agent 是新的应用,Prompt 是新的程序,Token 是新的货币。

这背后的本质,是全新的计算平台。

未来的软件,不再只是一个界面加一堆按钮,而会变成一个能自己做事的智能体。你给它的 prompt,不再只是输入框里的自然语言,而越来越像是在写程序。它处理和消耗的 Token,就是这个新系统里的流通单位。

如果说过去十几年企业软件的中心是 SaaS,那么接下来几年,真正改变企业流程的,很可能是 Agent。

过去,企业买的是软件和 SaaS,再花钱请系统集成商去部署和维护。未来,企业越来越像是在购买一种新的“智能劳动力”。

黄仁勋重新定义了企业买的到底是什么。

他提出了 AgaaS:Agent-as-a-Service。

这个缩写未必会像 SaaS 那样最终成为稳定术语,但它足够准确地表达了黄仁勋的判断:

企业软件市场接下来最大的增量,不是再卖一个功能模块,而是卖一个能替人做工作的 Agent。

于是底层逻辑也跟着变了:

● 传统数据中心主要存文件

● AI Factory 主要生产 Token

● 传统软件主要服务人

● 新一代系统会同时服务人和 Agent

4.6 万亿美元的 IT 产业,正在从“软件采购逻辑”切换到“智能劳动力采购逻辑”。

黄氏龙虾 NemoClaw :一行命令,把 Agent 从屏幕里拽出来

软件世界讲到这里,整场演讲其实还差最后一步:如果 Agent 真的是新的应用,它总不能永远只活在命令行、浏览器和聊天窗口里。

OpenClaw 的出现,才让这条线真正拐向了物理世界。

大会现场的预热环节,其实就请来了龙虾之父 Peter Steinberger 出场站台。

Peter 自己给出的出发点也很有意思。他想解决的问题,并不是某个传统意义上的机器人学难题,而是一个听起来几乎过于朴素的需求:人有时候就是想直接和电脑说话,而且不只是让它回答,而是真的替你做事。正是在这个意义上,OpenClaw 才迅速引发共鸣,抓住所有开发者和知识工作者都已经开始感受到的那种冲动:我们不再满足于 AI 会聊天,我们开始要求它动手。  

到了黄仁勋真正把它接到 Keynote 主线里的时候,OpenClaw 的定位又被抬高了一层,还专门做了一个短片,讲述 OpenClaw 如何超越 Linux 和 React,让今年改元为“龙虾元年”。

随后就是王炸:NemoClaw 发布。

但这不仅仅是老黄跟紧热度,也发布了一个英伟达风格的龙虾,而是做一件更大的事:

把 Agent 从电脑屏幕里拽出来,塞进一个真实能动的机械系统里。

这只“黄氏龙虾”从我们认知中的 Agent,变成了一个开放的机器人操作底座,一个足够标准化、足够友好、也足够有社区属性的开源硬件入口。就像早年的 PC 之于个人计算,树莓派之于嵌入式开发,重点不是极限性能,而是门槛足够低、生态足够容易长出来。

NemoClaw 是 NVIDIA 往硬件里塞进去的那颗“大脑”。

它不是简单地给机器人接上一个模型接口,而是把 Agent 那套能力真正带到了物理世界:理解自然语言、感知环境、规划动作、调用工具、执行任务。最关键的是,黄仁勋用了一种极其程序员友好的方式来展示它——不是复杂的机器人工作站,不是一堆控制台,而是一行命令。

那种感觉非常直接:像是在给一台机器“装系统”。

这背后的含义很重。

它意味着机器人开发的门槛,正在从“必须有机器人学博士团队”下降到“会命令行、会接模型、会调 API 的开发者也能开始上手”。这不等于机器人难题已经解决了,但它意味着入口正在被打穿。

所以 NemoClaw 真正重要的,不是“它支持什么功能”,而是它试图复制 NVIDIA 当年在 CUDA 和 cuDNN 上做过的事:

● 先把底层平台搭好

● 再把复杂性封装掉

● 然后把开发门槛尽可能压低

● 最后让生态自己长出来

如果 CUDA 让并行计算从少数专家的能力变成主流开发者的能力,cuDNN 让深度学习从顶尖实验室走向整个产业,那么 NemoClaw 想做的,就是把这种民主化逻辑推到机器人和 Physical AI 领域。

从 NemoClaw 往后,黄仁勋顺势也聊到了 Physical AI 和具身智能。

这里的关键词不是“机器人”,而是仿真优先。

AI 如果真的要改变世界,就不能只活在云里。它得进入物理世界,得能看、能听、能碰、能动。而一旦进入物理世界,它面对的就不再是干净的数据集,而是摩擦、惯性、遮挡、碰撞、噪声、延迟、失误。

这也是为什么 NVIDIA 把 Isaac Lab、Newton、Cosmos、GROOT 这套东西一起摆出来。

可以把它理解成:NVIDIA 正在给 Physical AI 搭一整条流水线——从数据生成、仿真训练,到强化学习、再到现实部署。它不是只想给你一个机器人模型,而是想给你一个从虚拟世界走到现实世界的完整开发系统。

而且这不只是实验室概念。黄仁勋点到的那些合作方向——手术室助手机器人、全身控制、人形机器人、制造业训练、Disney Research——已经足够说明问题:

Physical AI 正在从 demo 走进产业真实需求。

语毕,黄仁勋自然引出了全场最后一个爆点,也是最有画面感的一幕:雪宝,Olaf。

一个原本属于动画电影《冰雪奇缘》的角色,从屏幕里走到了现实世界。

但它并不只是“可爱”。

它真正想说明的,是 NVIDIA 现在试图打通的一整条链路:

● 角色诞生于数字内容世界

● 行为在仿真环境里被训练

● 物理控制在 Newton 这样的引擎里被优化

● 最终进入真实世界里行动

黄仁勋现场和雪宝的互动,某种程度上比前面那些曲线图、收入图都更容易让普通人一下子理解 Physical AI 到底意味着什么。

因为它不再是一个机械臂抓方块,而是一个熟悉的、来自流行文化的角色,真的站到了现实世界里。

这一幕很像整个 Keynote 的隐喻:

数字世界里的智能,正在向现实世界外溢。

这家公司最早改变的是图形计算,后来改变的是 AI 计算。现在,它开始试图去定义:当智能真正从屏幕里走出来之后,下一代世界会长成什么样。

(投稿或寻求报道:zhanghy@csdn.net)

【活动分享】"48 小时,与 50+ 位大厂技术决策者,共探 AI 落地真路径。"

由 CSDN 与奇点智能研究院联合举办的「全球机器学习技术大会」正式升级为「奇点智能技术大会」。

2026 奇点智能技术大会将于 4 月 17-18 日在上海环球港凯悦酒店正式召开,大会聚焦大模型技术演进、智能体系统工程、OpenClaw 生态实践及 AI 行业落地等十二大专题板块,特邀来自BAT、京东、微软、小红书、美团等头部企业的 50+ 位技术决策者分享实战案例。

这不仅是一场技术的盛宴,更是决策者把握 2026 AI 拐点的战略机会。

图片

Logo

小龙虾开发者社区是 CSDN 旗下专注 OpenClaw 生态的官方阵地,聚焦技能开发、插件实践与部署教程,为开发者提供可直接落地的方案、工具与交流平台,助力高效构建与落地 AI 应用

更多推荐