人工智能(AI)智能体(Agent)无疑是当下最热门的技术话题之一。我们不再满足于与模型进行简单的问答,而是期望它们能像一个真正的助手一样,自主地理解任务、调用工具、并完成复杂的工作流。最近,Anthropic 的三位核心成员——Alex Albert(Claude 关系主管)、Brad Abrams(产品负责人)和 Katelyn Lesse(工程主管)——进行了一次深度访谈,系统地阐述了他们围绕 Claude 构建智能体的演进历程、核心理念和未来蓝图。

这次访谈的核心思想可以概括为一个词:“解放”(unhobble)。他们认为,构建更强大智能体的未来,不在于为模型设计更复杂的脚手架(scaffolding),而在于拆除束缚,赋予模型所需的工具和自主权,让其日益增长的智能得以充分释放

从 API 到平台:一个新时代的开启

首先,一个显著的变化是,Anthropic 不再称其服务为“Anthropic API”,而是升级为**“Claude 开发者平台”**(Claude Developer Platform)。这不仅仅是一个名称的变更,它标志着一次重要的战略演进。

过去,它只是一个简单的模型访问接口。而现在,这个平台整合了 API、SDK、文档、控制台体验、提示缓存(prompt caching)、批量处理 API(batch API)、网页搜索与抓取(web search and web fetch)以及代码执行等一系列强大的功能。它已经从一个单一的工具演变成一个完整的生态系统,旨在为开发者提供构建尖端应用所需的一切。有趣的是,就连 Anthropic 内部的产品,如 claude.code,也是直接构建在这个公开的平台之上的,这体现了其稳健性和实用性。

智能体的核心:自主性与“解放模型”

在讨论如何构建智能体之前,Anthropic 首先明确了他们对“智能体”的定义。在他们看来,智能体的核心在于自主性(autonomy)。一个真正的智能体应该能够:

  • 自主选择需要调用的工具
  • 执行这些工具调用
  • 处理返回的结果,并决定下一步行动

这与预先定义好每一步的固定工作流有着本质区别。Brad Abrams 指出,过度依赖脚手架来“指导”模型,虽然在某些场景下有用,但会给模型的能力设下天花板。当更强大的新模型发布时,一个被重度脚手架束缚的系统可能无法完全利用新模型带来的智能提升。

这引出了访谈中最核心的理念——“解放模型”(unhobbling the model)。随着模型智能水平的不断提升,开发者需要提供的“护栏”和“指导”越来越少。过去被认为是必需的复杂框架,如今在某些情况下反而成了“负债”,因为它限制了模型展示其全部智能的潜力。开发者应该将重心从“如何指导模型”转变为“如何为模型提供它完成任务所需的工具,然后放手让它自己去决策”。

一个绝佳的例子是平台提供的网页搜索工具。开发者只需简单地将这个工具提供给 Claude,模型就能自主地执行深度研究任务:它会自行调用搜索,分析结果,判断哪些链接有价值,然后进一步抓取网页内容,整个过程高度自动化。这种转变将智能应用的重心从开发者的创造力转移到了模型的推理能力上,极大地拓宽了应用场景的可能性。

实践出真知:构建高效智能体的三大支柱

Anthropic 不仅提出了理念,还提供了具体的工具和最佳实践,帮助开发者将这一理念付诸实践。

  1. Claude 智能体 SDK (前身为 Claude Code SDK) 许多开发者在构建智能体时,都会重复实现管理工具调用和循环逻辑的工作。为了解决这个问题,Anthropic 推出了 Claude 智能体 SDK。这个 SDK 最初为代码生成任务设计,但在团队移除了特定于编码的脚手架后,发现它本质上是一个优秀、通用的智能体“骨架”(agentic harness)。它为开发者提供了一个开箱即用的“智能体循环”,自动处理了大部分工具调用的逻辑,让开发者可以从一个更高的起点开始构建,而无需从零开始。

  2. 精细化上下文与记忆管理 Claude 拥有高达 200k 甚至 100 万 token 的上下文窗口,但这并不意味着越大越好。研究发现,通过精简和整理上下文,反而能让模型表现得更出色。为此,平台推出了新功能,允许模型在多轮工具调用后,自主移除那些已经不再需要的旧工具调用记录。为了避免模型“失忆”,系统会留下一个“墓碑”(tombstone),告知模型这里曾有过信息但已被移除,从而实现上下文的“断舍离”。

    此外,平台还引入了**“智能体记忆”(agentic memory)工具。就像人类在多次执行同一任务后会变得更熟练一样,这个工具允许模型在执行任务时“做笔记”——例如,记录哪个网站是更可靠的信息来源,或者哪种搜索方式更有效。当再次遇到类似任务或陷入困境时,模型可以查阅这些笔记,从而实现持续学习和自我改进**。

  3. 从商业价值出发 技术最终要服务于实际问题。Anthropic 强调,在启动一个智能体项目前,最重要的事情是明确其商业价值。思考这个智能体究竟能解决什么问题?是节省工程时间,还是减少人工操作?清晰地定义预期成果,有助于圈定项目范围,确保技术能带来真正的商业影响力。

展望未来:一个拥有“计算机”且能自我完善的 Claude

访谈的最后,团队描绘了一幅激动人心的未来图景。

  • 可观测性(Observability):随着智能体被赋予更多自主权,如何监控、审计和调试它们的行为变得至关重要。未来的开发者平台将提供强大的可观测性工具,让开发者能够深入了解智能体在执行长时任务时的内部状态。
  • 自我完善的飞轮:通过将更高阶的抽象(如智能体 SDK)、可观测性以及记忆功能相结合,Anthropic 旨在创造一个**“自我完善的飞轮”**。用户构建的智能体将不再是静态的,而是能够在一次次执行任务的过程中变得越来越好。
  • 给 Claude 一台“计算机”:这是整个访谈中最具想象力的愿景。Brad Abrams 打了一个比方:我们现在使用 Claude,就像雇佣了一名员工却没有给他配电脑。代码执行功能只是“给电脑”的第一步。未来,他们希望为 Claude 提供一个持久化的计算环境,让它能像人类一样管理文件、配置工具、组织工作空间。这才是对模型最彻底的“解放”,也将释放出难以估量的潜力。

结论

Anthropic 的这次访谈为我们揭示了一条清晰的路径:智能体的未来不在于构建更复杂的“牢笼”,而在于为日益聪明的“鸟儿”提供更广阔的天空和更有力的翅膀。通过**“解放模型”**这一核心哲学,并辅以强大的平台工具,开发者将能构建出真正自主、高效且能够自我进化的 AI 智能体,开启人机协作的全新篇章。


原始视频:https://youtu.be/XuvKFsktX0Q?si=EQxKzQyL8SS_I6pM
中英文字幕:

Building the future of agents with Claude 中英文字幕

Logo

更多推荐