AI Agent的真正拐点——Claude Code
速度和性能固然重要,模型也是智能体的动力源,但未来的性能衡量标准将是制作一个网站所需的“数据包净输出”,而不是数据包本身的质量。鉴于编程领域的“杀手级用例”,以及 Claude Code / Cowork 清晰的通用性,这证明了一个完全不同的计算逻辑是合理的。如果说早期的 ChatGPT API 像 Web 1.0 时代的 TCP/IP 协议——点对点的请求与响应,那么现在我们正进入类似 Web
目前,GitHub 上 4% 的公开代码正由 Claude Code 撰写。按照目前的轨迹,SemiAnalysis认为到 2026 年底,Claude Code 将占据所有每日代码提交量的 20% 以上。就在不经意间,AI 已经吞噬了整个软件开发领域。
Fabricated Knowledge曾将软件比作互联网兴起时的线性电视,并认为 Claude Code 的崛起将成为软件之上的一个新的智能层,类似于 DRAM 与 NAND 的关系。
本文主要基于SemiAnalysis最新发布的《Claude Code is the Inflection Point》研究报告,将深入探讨 Claude Code 的影响、它究竟是什么?为何如此强大?又将如何重塑产业格局?

来源:Tokenomics Team, Github, 由 Claude Code 生成
SemiAnalysis认为,Claude Code 是 AI Agent时代的真正拐点,也是 AI 未来运作模式的一次预演。它有望在 2026 年为 Anthropic 带来爆发式收入增长,甚至可能在规模上显著超越 OpenAI。
SemiAnalysis构建了一个详尽的 Anthropic 经济模型,并精确量化了其对云合作伙伴(AWS、Google Cloud、Azure)以及相关供应链(如 Trainium2/3、TPU 和 GPU)的收入和资本支出(CapEx)影响。
Anthropic 有望在未来三年内增加与 OpenAI 相当的算力。参考SemiAnalysis的“数据中心行业模型”,可以逐个建筑地追踪 Anthropic 和 OpenAI 的部署情况。
值得注意的是,Sam Altman 的 AI 实验室正遭受多个数据中心延期的困扰——这一点SemiAnalysis在几个月前就已指出,尤其是在Coreweave 2025 年第三季度财报预览中,明确指出了其资本支出指引的重大失误。

来源:SemiAnalysis 数据中心模型
鉴于更多的算力意味着更多的收入,可以预测年度经常性收入(ARR)的增长,并将 Anthropic 与 OpenAI 进行直接比较。

来源:SemiAnalysis Tokenomics 模型
值得注意的是,预测显示 Anthropic 的季度 ARR 增量已经超过了 OpenAI。Anthropic 每月增加的收入比 OpenAI 还要多。其中,Anthropic 的增长将主要受到算力的限制。
Claude Code与智能体未来
未来,人类与 AI 的主要交互方式将是 Agent。而 Claude Code 不仅展示了人类如何使用 Agent,也展示了 Agent 如何反向组织人类的工作流程。SemiAnalysis认为,AI 的未来不是简单“卖 Token”,而是“编排 Token”。如果说早期的 ChatGPT API 像 Web 1.0 时代的 TCP/IP 协议——点对点的请求与响应,那么现在我们正进入类似 Web 2.0 的阶段:真正创造价值的不是协议本身,而是构建在其上的应用。
历史证明,基础协议重要,但真正创造万亿美元价值的是建立在协议之上的应用层。Claude Code 正是这样的应用层创新。
从 GPT-3 证明规模有效,到 Stable Diffusion 展示生成图像能力,再到 ChatGPT 验证“智能的市场需求”,每个阶段都拓展了 AI 的能力边界。而 Claude Code,则突破了“Agent 层”的组织能力。

来源:SemiAnalysis Tokenomics 模型,由 Claude Code 生成
什么是 Claude Code?
Claude Code 是一个终端原生的 AI 智能体,它并不专注于 IDE 或像 Cursor 那样的聊天机器人侧边栏。Claude Code 是一个 CLI工具,它可以读取你的代码库,规划多步骤任务,然后执行这些任务。
如果仅仅把 Claude Code 看作专注于“代码”可能是不准确的,更应该把它看作 Claude Computer。通过完全访问你的计算机,Claude 可以理解其环境,制定计划,并迭代完成该计划,全程接受用户的指导。
Claude Code 不仅仅是写代码,它是 AI 智能体的最佳范例。你可以使用自然语言与计算机交互,描述目标和结果,而不是实现细节。给 Claude(CLI)一个输入——比如一个电子表格、一个代码库、一个网页链接,然后要求它实现一个目标。它会制定计划,验证细节,然后执行。
工程师们正在进行 “Vibe Coding(直觉式编程)”:
一年前创造了“Vibe Coding”一词的Andrej Karpathy公开讨论了这种阶段性转变,并特别指出:“我已经注意到,我手动编写代码的能力正在慢慢退化。生成(写代码)和辨别(读代码)是大脑中不同的能力。”
Vercel CTO Malte Ubl声称他的“新主要工作”是“告诉 AI 它哪里做错了”。
NodeJS 创始人Ryan Dahl表示“人类编写代码的时代已经结束”。
Ruby on Rails 创始人David Heinemeier Hansson产生了一种预期的怀旧感,一边还在手动写代码,一边却在怀念手动写代码的日子。
Claude Code 创始人Boris Cherny表示:“我们的代码几乎 100% 的代码都是由 Claude Code + Opus 4.5 编写的。”

甚至 Linus Torvalds 也在进行 Vibe Coding:https://github.com/torvalds/AudioNoise
但这不仅仅局限于程序员。在 SemiAnalysis,我们的分析师和技术人员有着不同的角色和职责:
* 数据中心模型团队每周需要审查数百份文件。
* AI 供应链团队需要检查包含数千个行项目的 BOM(物料清单)。
* 内存模型团队需要在现货市场价格爆炸时近乎实时地建立预测。
* 技术人员需要维护 InferenceMAX 的实时仪表板,包括每晚在 9 种不同系统类型/集群上运行最新的软件配方。
从监管文件到许可证,从规格表到文档,从配置到代码,我们与计算机交互的方式已经改变。
作为一个例子,行业模型分析师现在使用 Claude Code 生成大量有用的图表和分析,以解析和传达大数据集中的重要趋势:
输入如下:

来源:SemiAnalysis, Claude Code
输出如下:

程序员将停止“写代码”,转而要求“任务被完成”。Claude Code 的魔力在于它确实有效。许多著名的程序员终于屈服于 Vibe Coding 的新浪潮,并意识到编码实际上是一个接近被解决的问题,相比人类,它更适合由智能体来支持。
竞争的焦点正在转移。 痴迷于线性基准测试来争论哪个模型是“最好的”,看起来将变得过时,就像当年比较拨号上网和 DSL 的速度一样。速度和性能固然重要,模型也是智能体的动力源,但未来的性能衡量标准将是制作一个网站所需的“数据包净输出”,而不是数据包本身的质量。未来的网站功能将通过工具、记忆、子智能体和验证循环的编排来实现,创造的是结果而非简单的回复。所有的信息工作最终都将由模型来处理。
Opus 4.5 是实现这一切的引擎,而线性基准测试中的重要指标,对于智能体的长周期任务可能完全无关紧要。
超越编程,信息工作全面自动化
编程曾是所有工作中价值最高的,程序员在 2020 年代的软件工程时期炙手可热。现在,编程已成为代理化信息处理颠覆的滩头阵地,规模高达 15 万亿美元的更广泛的信息工作经济正面临风险。根据国际劳工组织(ILO)的数据,全球有 10 亿以上的信息工作者,约占全球 36 亿劳动力的三分之一。
信息工作类别中的每一个工作流通常都很相似,并共享一个 Claude Code 在软件领域已证明有效的工作流:感知(摄取非结构化信息)-> 思考(应用领域知识)-> 输出(产出结构化输出)-> 验证(根据标准进行检查)。 这涵盖了大多数信息工作者(包括研究)的大部分工作,如果智能体能吞噬软件行业,还有哪个劳动力池是它们无法触及的?
随着 Claude Code(以及 Cowork)的兴起,智能体的总潜在市场(TAM)远大于仅仅是 LLM(大语言模型)。像客户支持和软件开发这样的利基市场,将开始向更大的金融服务、法律、咨询和其他行业扩展。这正是 SemiAnalysis Tokenomics 模型的核心关注点。

来源:McKinsey, Mordor Intelligence, Grand View Research,Precedence Research. 由 Claude Code 生成
鉴于编程领域的“杀手级用例”,以及 Claude Code / Cowork 清晰的通用性,这证明了一个完全不同的计算逻辑是合理的。自动化大部分“呼叫与响应”和信息获取是可行的,这打开了绝对美元价值的大门。Tokenomics 模型的目标是追踪额外的杀手级用例和 TAM,观察代理化 AI 如何扩展到商业的各个方面。
制约因素:任务处理时长
真正让更大的蛋糕通过颠覆变得触手可及的,是更长的任务跨度。一个智能体在任务失败前能工作多久?METR 数据显示,自主任务跨度每 4-7 个月翻一番(在 2024-2025 年加速至约 4 个月)。

来源:METR, SemiAnalysis Tokenomics Team
每一次翻倍都解锁了更多的总蛋糕份额。在 30 分钟时,你可以自动完成代码片段;在 4.8 小时时,你可以重构一个模块;而对于多天的任务,你可以自动化整个审计流程。很明显,Anthropic 也看到了这一点。
2026 年 1 月 12 日,Anthropic 推出了 Cowork——“面向通用计算的 Claude Code”。四名工程师在 10 天内构建了它,大部分代码由 Claude Code 自身编写。架构相同:Claude Agent SDK、MCP、子智能体。它可以从收据创建电子表格,按内容组织文件,并从零散的笔记中起草报告。这就是去掉了终端、加上了桌面的 Claude Code。


一个能够理解你日常工作背景的工具,可以根据需要构建和生成信息处理。智能体不再是你从数据库下载报告然后制作图表,而是会为你生成格式比你自己用 Excel 做得更好的报告。每当你需要收集关于(比如)销售配额的信息时,你的智能体将从 UI 或 API 中提取信息,并代表你生成报告。信息工作本身将被自动化,就像 Claude Code 自动化软件工程一样。

来源:SemiAnalysis
虽然目前还不完美,但它显然通常能比大多数人类更快地处理、合成和格式化数据。在某些情况下,这一切都伴随着比普通工人更高的保真度和更低的成本。虽然会有幻觉,但大多数现有的系统中本就充满了人类导致的错误。
如果信息以可行的保真度处理并传递到下一步,这本身将大规模增加工作的供给。我们确实到了这样一个节点:任何个人都可以输入进这些智能体工作流,运行一个在 2000 年代需要终身训练才能完成的多变量回归分析。
Stack Overflow 2025 开发者调查显示,84% 的程序员正在使用 AI,而这还只是采用的最前沿。只有 31% 的人使用编程智能体,这意味着这一渗透曲线对于更广泛的信息工作浪潮来说还处于早期阶段。就像编程智能体渗透的“眨眼瞬间”一样,更广泛的信息工作将迅速见证 AI 的采用。
智能成本正在下跌
以前,软件工程一直是信息工作的标杆领域。但随着质量最终跨越了一个关键门槛,程序员与其工具之间的关系发生了逆转。程序员实际上只是在利用一个黑盒工具来实现结果,这一切之所以成为可能,不仅是因为质量的提升,更因为Token 智能的成本惊人地下降了。一个配备 Claude Code 的开发者现在可以完成以前需要一个团队一个月才能完成的工作。
Claude Pro 或 ChatGPT 的成本是每月 20 美元,而 Max 订阅分别是 200 美元。美国知识工作者的中位数成本约为每天 350-500 美元(全包)。一个智能体每天哪怕只处理他们工作流程的一小部分,成本仅需约 6-7 美元,这代表着 10-30 倍的投资回报率(ROI),这甚至还没算上智能提升带来的收益。
企业已经开始行动
分析指出,智能体大规模降低成本已经使得不少企业开始采取行动。埃森哲(Accenture)刚刚签署了一项协议,培训 30,000 名专业人员使用 Claude,这是迄今为止最大的 Claude Code 部署。埃森哲将重点关注金融服务、生命科学、医疗保健和公共部门。这些都是信息自动化巨大的未开发市场。OpenAI同期推出的Frontier企业计划进一步印证了这一趋势。
企业软件成为此轮变革的首要冲击对象。传统SaaS商业模式依赖数据迁移成本、工作流习惯培养与系统集成难度构筑的护城河,正在被智能体技术逐步瓦解。AI代理能够以更低成本实现跨系统数据迁移,其工作流不依赖于为人类设计的交互界面,而通过MCP等协议大幅降低集成门槛。
当智能体可自主完成从数据库查询、图表生成到报告分发的完整流程时,传统软件高达75%的毛利率反而成为其脆弱性的体现。
一个简单的例子是,智能体现在可以代表你直接查询 Postgres 数据库,生成图表,并通过电子邮件发送给利益相关者。这实际上就是一个像 CRM 这样的 SaaS 工作流的成本,而且它不需要培训人类适应 UI 变化或更新软件。它只是“管用”。BI/分析(智能体查询数据库)、数据录入、ITSM(L1/L2 工单分流)和后台对账已经在自动化过程中了!这些已经开始敲响软件行业最神圣护城河的大门。
在SemiAnalysis看来,任何需要人类点击按钮、收集信息、将其重新格式化为另一种媒介(电子邮件、图表、Excel、演示文稿)的工作都面临巨大风险。LLM 专注于这种数据交换,能够毫不费力地将文本转换为音频,将英语转换为中文,将文字转换为图像。这对世界上最大的公司之一微软构成了巨大威胁。
微软的两难困境
成本结构的根本性变革正在瓦解以按用户数收费为核心的软件商业模式。以SemiAnalysis内部大规模部署Claude Code为例,受影响最深的是微软的Office 365套件。
微软正面临战略性两难:Azure的快速增长需要满足公开市场期待,而投资Copilot系列则是保护Office 365这一核心利润来源的必要防御。二者之间存在内在冲突,在任一领域取得突破,都可能以另一领域的退守为代价。作为OpenAI和Anthropic等AI领军企业的主要云服务商,微软实际上正通过出租算力,为可能瓦解其核心生产力软件护城河的颠覆性技术提供支持。
最新财报会议直观呈现了这一战略拉锯的紧绷态势。微软坦言,若将本财年前两季度全部新增GPU资源投入Azure,其关键增长指标将超过40%。然而公司最终选择优先保障M365 Copilot与GitHub Copilot等第一方AI产品的产能与增速。
值得玩味的是,当前由外部团队在微软生态内开发的“Claude for Excel”,其功能形态恰是微软自身Copilot for Excel原本应实现的目标。这反映了一个深层矛盾:公司当下的现金支柱仍来自Office,而长期估值则更多依赖Azure的增长前景。为加速后者,微软或许不得不默许外部创新力量对其传统护城河的持续侵蚀。
尽管GitHub Copilot与Office Copilot拥有近一年的先发优势,但其产品演进速度并未形成显著壁垒。在此背景下,首席执行官Satya Nadella亲自深度介入AI产品管理,暂时脱离日常CEO职责,这一罕见举动清晰表明:当前AI产品的竞争态势,已关乎微软整体未来的命运走向。
Anthropic的增长动力
基于对Anthropic的详细经济建模,SemiAnalysis量化了其扩张对AWS、Google Cloud及Azure等云服务商的收入贡献,以及对Trainium、TPU与GPU供应链的资本支出拉动。分析指出,未来三年Anthropic将部署与OpenAI相当的算力规模,其增长将直接受算力供给约束。
目前,Anthropic的季度年度经常性收入(ARR)增量已超越OpenAI,标志其在商业化进程上实现关键超越。这一趋势表明,在AI竞赛的下半场,算力规模与营收转化之间已形成强耦合。
Claude Code的成功,本质上是Opus 4.5模型在复杂任务中工程化能力的体现。当前行业对传统线性基准的过度关注正逐渐失去意义,在长周期、多步骤的智能体任务中,单一响应质量并非决定性因素。竞争焦点已从“生成最佳回答”转向“实现可交付成果”。
未来评估模型效能的核心指标,将逐步转化为任务完成度、系统稳定性及自动化边界,其价值体现在通过工具调用、记忆管理、子代理协调与验证闭环所实现的端到端输出,而非孤立的数据包质量。AI竞争正在从基准测试的实验室赛道,转向真实工作流的效率战场。
https://mp.weixin.qq.com/s/43y_Dq74J8u0gFYQFoaERQ
微信公众号【通信官】文章末尾“阅读原文”,获取SemiAnalysis《Claude Code is the Inflection Point》原文报告链接。
更多推荐

所有评论(0)