硅谷直击：黄仁勋携英伟达帝国入局龙虾大战，打造万亿美元 Agent 应用经济，推理算力需求暴涨万倍！

用户输入的是 Token，模型处理的是 Token，最后输出的也是 Token。再往后，从 AlexNet 的 6000 万参数，到 GPT-3 的 1750 亿，再到今天万亿级别的模型，模型在变，框架在变，但那套“更多算力、更多数据、更大模型”的逻辑一直没变。AI 真正补上的，不是把这些东西替代掉，而是让机器终于有能力去理解围绕它们的那些非结构化信息——文档、邮件、图片、合同、对话、代码、视频。

CSDN资讯

3281人浏览 · 2026-03-17 07:49:24

CSDN资讯 · 2026-03-17 07:49:24 发布

出品 | CSDN（ID：CSDNnews）

北京时间 2026 年 3 月 17 日凌晨，圣何塞 SAP Center 里，黄仁勋穿着那件标志性的皮衣上台，几句开场白之后，这场 GTC 就直接进入了高密度模式。

和隔着直播看完全不是一回事。我们这次直击现场，CSDN 创始人兼董事长蒋涛、奇点智能研究院院长兼 CSDN 高级副总裁李建忠带队亲赴硅谷 GTC 2026 大会现场。为你带回关于全球 AI 计算和英伟达战略的系列现场报道和深度解读。

现象最直观的感受不是“信息量很大”，而是黄仁勋对整场叙事节奏的控制：

CUDA 二十周年、Vera Rubin、光子互连、AI Factory、Agentic AI、NemoClaw、OpenClaw、数字孪生、Physical AI、雪宝走进现实……任何一个单拎出来都够做 headline。

在现场看这场演讲，会更容易意识到黄仁勋演讲的情绪带动能力。他其实并不是靠一次性抛出了多少新词，而是把这些东西讲成了一条完整的线：

从 GeForce 到 CUDA，从 CUDA 到深度学习，从深度学习到 Token 经济，从 Token 经济到 Agent，再从 Agent 走向机器人和物理世界。

老黄在这场演讲里，宣告了 SaaS 的死亡，揭幕了风云莫测的 Agent 时代。

AI 的下一阶段，不是更会聊天，而是开始真正干活。

CUDA 二十周年：那个“让 GPU 可编程”的赌注

黄仁勋这次没有一上来就报新品，而是先把时间拨回了 1999 年。

那一年，NVIDIA 做出了 GeForce 256，也就是后来被它定义为“世界上第一块 GPU”的产品。对普通用户来说，它改变的是 PC 游戏；但对黄仁勋来说，它更像是一个起点：GPU 天生适合处理那些可以被拆成海量小任务、并行执行的问题。

真正改变一切的，是 2006 年 CUDA 的发布。

从那一刻开始，GPU 不再只是用来渲染图形的显卡，而变成了一台可以被程序员直接调用的通用并行计算机器。开发者不需要再把自己的数据伪装成图形纹理，也不需要再绕着图形管线写各种技巧，终于可以正大光明地在 GPU 上写程序。

这件事的影响，远远超过了一代芯片升级。

分子动力学、流体模拟、地震处理、金融建模，这些原本就高度适合并行化的问题，一下子找到了真正匹配它们的底层平台。更重要的是，NVIDIA 没有把 CUDA 只做成一个接口，而是围绕它慢慢长出了一整个软件生态：cuBLAS、cuFFT、cuDNN、TensorRT……不同领域的人不需要从零掌握 GPU 编程，也能借助这些库，把自己的应用真正跑起来。

这就是黄仁勋反复讲的——CUDA 飞轮。

更多库，带来更多开发者；更多开发者，带来更多应用；更多应用，推动更多 GPU 部署；更多部署，再反过来支持更多研发。

二十年转下来，CUDA 已经不只是一个工具链，而像是加速计算时代的一套底层操作系统。

NVIDIA 最深的护城河并不是某块芯片，而是 CUDA 构筑的软件生态。

说得更直白一点：芯片可以追，参数可以抄，但二十年积累下来的开发生态、库、工作流和开发者习惯，不是说追就能追上的。

如果你也在关注 AI 计算、Agent 以及 NVIDIA 路线图，欢迎扫码加入 GTC 2026 交流群，查看大会直播视频回放！

Geoffrey Hinton 赌对了，NVIDIA 也赌对了

讲完 CUDA，黄仁勋把时间线拉到了 2012 年。

那一年，Alex Krizhevsky、Ilya Sutskever 和 Geoffrey Hinton 用两块 NVIDIA GTX 580 训练出 AlexNet，横扫 ImageNet。现代深度学习时代，就是从那一刻真正开始加速的。

这段历史今天看起来像常识，但在当年并不是。学术界对神经网络长期充满怀疑，真正一路坚持下来的人并不多，Geoffrey Hinton 就是其中最关键的一个。

黄仁勋提到，Hinton 当年押的是一个看似朴素、但当时并不主流的判断：只要数据足够多，算力足够大，神经网络就会不断变强。后来的历史证明，他赌赢了。

而 NVIDIA 押的是另一件事：如果深度学习成立，那 GPU 就会成为它最重要的底座。

事实也确实如此。

AlexNet 之后，NVIDIA 做出了 cuDNN，后来几乎所有主流深度学习框架都绕不开它。再往后，从 AlexNet 的 6000 万参数，到 GPT-3 的 1750 亿，再到今天万亿级别的模型，模型在变，框架在变，但那套“更多算力、更多数据、更大模型”的逻辑一直没变。

NVIDIA 不是在 ChatGPT 时代突然变重要，它只是提前二十年把路修好了。

而对于这其中的核心——数据，黄仁勋的判断是，企业里的两类数据，其实扮演着完全不同、但同样关键的角色：

● 结构化数据，是 AI 的基本事实

● 非结构化数据，是 AI 的上下文

数据库、表格、交易记录、库存数据，这些结构化信息是企业过去几十年最稳定、最可靠的资产。AI 真正补上的，不是把这些东西替代掉，而是让机器终于有能力去理解围绕它们的那些非结构化信息——文档、邮件、图片、合同、对话、代码、视频。

所以结构化数据和 AI 不是对立关系，恰恰相反，AI 会让结构化数据更值钱。

结构化数据像骨架，非结构化数据像血肉，而 AI 像是把这一切串起来的大脑。三者不是替代关系，而是组合关系。

这对企业来说是个很重要的判断：过去二十年积累下来的信息资产不会因为 AI 到来而失效，反而会因为新一代模型的理解能力变得更有价值。

AI 的真正爆发点，不再是训练，而是推理

接下来，黄仁勋把叙事重心从“过去二十年”切到“未来五年”。

这里有一个非常关键的判断：

AI 的重心，正在从训练转向推理。

而且，他没有只从技术角度讲这件事，而是给了一个很有冲击力的视角：Token Economics。

AI 经济的基本单位就是 Token。用户输入的是 Token，模型处理的是 Token，最后输出的也是 Token。于是 AI 的成本、收入、吞吐量，最后都落到同一个问题上：能以多快的速度、用多高的效率，生产出多少 Token。

这里最关键的变量，是 Token 消耗量正在急剧膨胀。

从 ChatGPT 到 o1，再到 Claude Code，单个任务的 Token 消耗已经不是翻倍，而是直接增长了四个数量级。

原因也很简单：过去那种一问一答的聊天式 AI，只是最轻量的一层。真正的 Agentic AI，一次任务里会不断思考、拆解、试错、调用工具、执行子任务，它消耗的 Token 规模和传统对话完全不是一个量级。

这也是为什么黄仁勋会反复强调一个说法：未来的数据中心，不再只是存储和检索数据的地方，而是生产 Token 的工厂。

也就是他这几年一直在推的概念：AI Factory。

黄仁勋真正要卖的是 Vera Rubin+ LPX

讲到这里，黄仁勋才正式把话题带进这次 GTC 的硬件主菜。

他先给 Blackwell 下了一个非常重的定义：它不只是 NVIDIA 历史上最成功的产品发布，甚至可能是整个计算产业史上最成功的一次发布。

这句话听起来很狂，但放在今天 AI 基础设施的供需关系里，也并不完全夸张。Blackwell 已经全面量产，几乎所有主要云厂商和 AI 公司都在围绕它部署。

但这场 GTC 当然不是一场庆功会。

Blackwell 再成功，也只是承前启后的一代。真正要接住 Agentic AI 这波需求爆炸的，是下一代架构：Vera Rubin。

这次黄仁勋又拿出了去年那张性能曲线图，甚至还顺手调侃了一下——大概只有 NVIDIA 的 Keynote，才会把去年的图再拿出来讲一遍。

但重点并不是复读，而是把问题讲得更清楚了：

未来 AI 推理不能只看“模型能不能跑”，而要看“以什么成本、以什么交互速度跑”。

图的纵轴，本质上是在看单位电力能产出多少 Token；横轴，本质上是在看每个用户能以多快速度拿到结果。

如果把这两个指标放在一起看，就会明白黄仁勋真正要表达的事：AI 服务会像云服务一样分层，从免费，到中档，到高端，再到超高端。模型越大、上下文越长、交互越快，底层硬件代际差异就越致命。

Rubin 的价值，不只是把 benchmark 做高，而是让那些原本“算不过来、也赚不过来”的高端推理服务，真正变成一门商业上可成立的生意。

如果说 Vera Rubin 是下一代引擎，那么 LPX 才是这部分真正的杀招。

黄仁勋给出的名字是 Groq 3 LPX。

不管外界之后怎么进一步解读这个命名，在 Keynote 的语境里，它最重要的意义只有一个：NVIDIA 正在把大规模 AI 系统的芯片互连，从铜推向光。

这件事为什么重要？

因为当系统规模做到 NVL72 这种级别之后，瓶颈早就不只是单块 GPU 的算力，而是整个系统内部到底能不能高速、低功耗、长距离地通信。铜线当然可以继续用，但功耗、热量、距离，都会越来越快地碰到边界。光子互连打开的，恰恰是更大规模 AI 系统的上限。

黄仁勋最擅长做的一件事，就是把一个底层技术变化，直接翻译成商业结果。

加上 LPX 之后，在高价值的 Premium 场景里，Vera Rubin + LPX 相比 Blackwell，性能效率可以拉到 35 倍。

而同样是一吉瓦电力，Blackwell 时代大概能对应数百亿美元量级的年度收入，而到了 Vera Rubin + LPX 这一代，这个数字被直接拉到了 3000 亿美元。

这当然有黄仁勋一贯擅长的放大表达，但它背后的逻辑并不复杂：

● 交互速度更高

● 上下文更长

● Agent 工作流更复杂

● 高客单价 AI 服务终于跑得动

● 单位电力产出的商业价值被成倍放大

最后落到一句最朴素的话上：

能效就是钱。

NVIDIA 现在连路线图都开始像软件公司了

接下来是 roadmap。这是惯例，画完今年的饼，就会画下一年的饼，确保订单量源源不断。

但这次路线图真正值得关注的，不是单纯“2025 是谁、2026 是谁、2027 是谁”，而是黄仁勋传递出来的节奏感：

NVIDIA 现在是按“一年一代”的速度在往前推。

● 2025：Blackwell

● 2026：Vera Rubin

● 2027：Vera Rubin Ultra

● 2028：Feynman

如果熟悉半导体行业，就会知道这有多凶。传统意义上的大架构切换，并不是这个速度。黄仁勋等于是在向所有云厂商、AI 公司和资本市场发信号：

别再用传统芯片周期去理解 NVIDIA 了。未来几年，它会像软件公司迭代版本一样，持续往前压硬件路线图。

这也是为什么今天越来越多的云厂、国家级算力项目和资本支出计划，都得围着 NVIDIA 的路线图转。数据中心设计、供电散热、网络拓扑、采购节奏，最后都会被这条 roadmap 牵引。

“历史上最大规模的基础设施建设，已经开始了。”

这也是整场演讲里最值得记住的一句话之一。

因为它不是在形容 NVIDIA 自己，而是在定义这个时代的背景：未来五年，全球会用一种接近修电网、铺铁路、建通信网络的方式，去建设 AI 基础设施。

黄仁勋点了很多名字：微软、AWS、Google、Meta、Oracle、CoreWeave、xAI，也提到了多个国家和地区。重点不在名单本身，而在于一个信号：

AI 算力正在从企业采购行为，升级成国家级战略资产配置。

这意味着 AI Factory 不再只是几个互联网巨头的事，而会像过去的发电站、铁路、港口、光纤网络一样，成为下一轮全球竞争的底层基础设施。

这也是为什么，黄仁勋可以顺理成章地把叙事从 AI 工厂接到数字孪生和 Physical AI。因为当基础设施已经按照“国家工程”的量级在建设，NVIDIA 当然不会满足于只做其中一层芯片。

企业软件将迎来从 SaaS 到 Agent-as-a-Service 的范式转换

如果说前半场黄仁勋在铺垫基础设施，那么后半场真正的主角只有一个：Agentic AI。

这里有一个很重要的区分：Agent 不是更会聊天的大模型，也不是把 prompt 写长一点的 ChatGPT。它是一套能感知环境、调用记忆、读取文件、使用工具、拆解任务、调度子 Agent，最后自己把事情做完的系统。

Agent 不再只是回答问题，它开始处理任务。它不只是对话入口，而越来越像一个调度中心。多模态输入进来，记忆、文件、外部工具、命令行、MCP 接口、子 Agent 全部围着它转。

所以黄仁勋这次给出了一个非常浓缩、也很适合传播的判断：

Agent 是新的应用，Prompt 是新的程序，Token 是新的货币。

这背后的本质，是全新的计算平台。

未来的软件，不再只是一个界面加一堆按钮，而会变成一个能自己做事的智能体。你给它的 prompt，不再只是输入框里的自然语言，而越来越像是在写程序。它处理和消耗的 Token，就是这个新系统里的流通单位。

如果说过去十几年企业软件的中心是 SaaS，那么接下来几年，真正改变企业流程的，很可能是 Agent。

过去，企业买的是软件和 SaaS，再花钱请系统集成商去部署和维护。未来，企业越来越像是在购买一种新的“智能劳动力”。

黄仁勋重新定义了企业买的到底是什么。

他提出了 AgaaS：Agent-as-a-Service。

这个缩写未必会像 SaaS 那样最终成为稳定术语，但它足够准确地表达了黄仁勋的判断：

企业软件市场接下来最大的增量，不是再卖一个功能模块，而是卖一个能替人做工作的 Agent。

于是底层逻辑也跟着变了：

● 传统数据中心主要存文件

● AI Factory 主要生产 Token

● 传统软件主要服务人

● 新一代系统会同时服务人和 Agent

4.6 万亿美元的 IT 产业，正在从“软件采购逻辑”切换到“智能劳动力采购逻辑”。

黄氏龙虾 NemoClaw ：一行命令，把 Agent 从屏幕里拽出来

软件世界讲到这里，整场演讲其实还差最后一步：如果 Agent 真的是新的应用，它总不能永远只活在命令行、浏览器和聊天窗口里。

OpenClaw 的出现，才让这条线真正拐向了物理世界。

大会现场的预热环节，其实就请来了龙虾之父 Peter Steinberger 出场站台。

Peter 自己给出的出发点也很有意思。他想解决的问题，并不是某个传统意义上的机器人学难题，而是一个听起来几乎过于朴素的需求：人有时候就是想直接和电脑说话，而且不只是让它回答，而是真的替你做事。正是在这个意义上，OpenClaw 才迅速引发共鸣，抓住所有开发者和知识工作者都已经开始感受到的那种冲动：我们不再满足于 AI 会聊天，我们开始要求它动手。