使用工具构建AIAgent时,选择哪些工具才能让模型如鱼得水?本文结合Anthropic团队构建ClaudeCode的经验,总结出了设计合适工具的底层原理。

1 工具与模型能力匹配

Agent的行动空间是它可以调用的工具集合。合理配置这一空间是构建可靠Agent的基础。

1.1 行动空间的挑战

✅ 问题定位

构建Agent时,开发者会面对众多工具选项,包括代码执行、bash命令、skills等。一个关键问题是:应该提供一个万能工具还是几十个专用工具?

Anthropic团队在文章中指出,工程师需要像解数学题一样选择工具,最重要的是让工具与模型能力匹配。模型如果只能手工运算,提供超级复杂的接口只会让它困惑;如果具备编程能力,授予可运行代码的接口能释放更大潜力。

✅ 能力匹配原则

开发者先观察模型的输出、阅读其行为并通过实验确认能力边界。设计工具时应考虑以下因素:

1.2 全能与专用工具权衡

✅ 全能工具的诱惑

看似一个万能的代码执行接口可以完成任何操作,但其问题在于模型要自己决定何时调用、如何传参。如果没有充分的上下文,它可能既不会使用,也可能滥用,增加决策负担。

✅ 专用工具的优势

Anthropic团队提倡使用针对单一任务的专用工具。例如,专门的AskUserQuestion工具可指导模型向用户提问,并保证输出结构一致。专用工具减少了歧义,使模型更容易学习何时调用,进而提高效率。

2 工具迭代

设计行动空间不是一次性的。随着模型能力提升,曾经必需的工具可能成为束缚。

2.1 AskUserQuestion演化

✅ 需求分析

在早期版本中,Claude的提问能力依赖纯文本。用户觉得这种方式耗时且不流畅。

✅ 尝试路径

扩展ExitPlanTool:试图让退出计划工具同时生成计划和问题,但计划与问题的结合导致逻辑混乱;

改变输出格式:要求模型以特定Markdown格式编写问题,便于前端解析。但模型经常偏离格式或丢失选项;

最终团队创建了AskUserQuestion工具。模型在规划阶段可调用该工具,弹出模态框阻塞循环直至用户回答。该工具提供了结构化输出、多选项保证及组合使用的可能性,而且模型乐于调用。

✅ 技术原理

AskUserQuestion背后的关键是通过显式的工具描述和严格的调用模式,降低模型生成自由度,确保输出结构化。这与LLM的序列生成本质相辅相成,避免模型在开放文本中走偏。通过将提问与控制流分离,实现了操作与内容的解耦。

2.2 待办列表到任务管理

✅ Todo工具的局限性

初期版本中,团队用TodoWrite工具记录待办事项,并每五轮用系统消息提醒模型其目标。然而随着模型推理能力提高,这种强制提醒反而限制了模型的灵活性,甚至使模型误认为必须严格遵循列表。

✅ 引入Task工具

团队将TodoWrite替换为Task工具,强调跨子Agent共享和依赖管理。Task不仅允许创建、修改、删除任务,还能表达任务间的依赖关系,并在子Agent间共享状态。该设计体现了多Agent协调的思想,即通过结构化任务驱动Agent协作,从而适应更复杂的项目场景。

✅ 反思与启示

这段经验说明工具需要随着模型能力的进化而更新。随着模型拥有更强的短期记忆和规划能力,冗余的提醒机制会成为桎梏。保持工具的简洁和灵活是设计中的重要原则。

3 搜索接口

有效的Agent不仅要会调用工具,还要主动获取所需信息。构建上下文的方式决定了Agent的能力上限。

3.1 RAG与自助搜索

✅ 早期RAG方案

Claude Code起初使用RAG(Retrieval-AugmentedGeneration)向量数据库为模型提供上下文。但这种方法需要索引和配置,在不同环境下容易出错。更关键的是,RAG属于被动喂食,模型无法根据具体任务主动选择所需信息。

✅ Grep工具的引入

团队发现,如果模型能搜索互联网,那么它也可以搜索代码库。通过提供Grep工具,让Claude自己搜索文件并构建上下文。这种方式让模型从被动接受信息转变为主动探索,提升了上下文构建的针对性和效率。

✅ 动态检索与渐进披露

改用实时加载策略:不预先加载所有数据,而是在需要时利用工具读取文件或运行查询。这种Just-in-time策略通过文件路径或查询结果的轻量引用动态加载数据,避免了RAG索引失效和上下文窗口浪费。允许Agent自行导航文件系统可以启用渐进式披露,即模型通过逐步探索递增获取相关信息。

3.2 渐进披露

✅ UX原理

渐进式披露最初是用户体验中的设计理念。它通过分步展现信息和操作,避免用户一次接收过多信息。核心思想是先提供必要的概览,再逐步深入,让用户从一般到具体地获取信息。

✅ 在Agent中的应用

逐步披露在Agent领域同样适用。模型不需要一次加载全部文档,而是通过工具逐步搜索、过滤、引用相关信息。ClaudeCode的技能系统便利用了这一理念:skill文件可引用其他文件,模型递归地查找内容,通过层层探索构建上下文。这种渐进披露减少了上下文的噪音,避免了模型因信息过载而出现注意力稀释现象。根据Anthropic的分析,随着上下文长度增加,模型检索信息的准确性会下降,需要精心策划引入信息的顺序和数量。

4 Claude Code Guide子Agent实践

除了单一Agent,复杂任务常需要子Agent分工合作。合理设计子Agent及其工具可大幅提升系统效率。

Claude并不了解如何使用自身平台。例如添加新命令或配置MCP时,它会答不上来。将所有文档放入系统提示会占用大量上下文,且用户很少询问这些问题,因此不划算。

团队构建了Claude Code Guide子Agent。当用户询问关于平台的问题时,主Agent会调用子Agent。Guide子Agent具有更详细的指令,能有效搜索文档并返回简洁答案。这种分工方式避免了在主Agent中加载大量与当前任务无关的文档信息,实现了渐进披露。

通过子Agent提供专业服务,可以在不增加工具数量的情况下扩展功能。子Agent的指令集更狭窄,模型易于理解和执行。这体现了一种微服务化的思路:将复杂任务拆分为多个职责明确的组件,提高整体效率并减少主Agent的认知负担。

5 长期任务

当Agent需要长时间运行或处理大型项目时,如何维护稳定的上下文成为一大挑战。

5.1 上下文稀释

✅ 上下文窗口有限

LLM的注意力预算是有限的,随着上下文长度增加,模型检索信息的精度会降低,出现contextrot现象。这是由于Transformer架构需要计算O(n²)的注意力关系,长序列会稀释模型的注意力。

✅ 即时检索策略

为应对这种限制,Anthropic提出了即时检索与动态加载的方法,让Agent通过工具按需加载所需文件或数据,而不是预先将全部信息放入上下文。这种策略不仅节省了上下文空间,还允许模型逐步探索环境。

5.2 结构化记忆

✅ 内容压缩

长期任务需要跨越多个上下文窗口。Anthropic介绍了压缩技术:在上下文接近极限时,模型总结已发生的内容,并用压缩信息替换原始信息。适度的压缩可保留关键决策和尚未解决的问题,同时去除冗余工具输出。

✅ 结构化笔记

另一种策略是将重要笔记存储在上下文窗口之外,在需要时再读取。例如,为Agent提供一个文件系统让其持久化笔记,类似人类的长期记忆。这种方法可提高跨会话的一致性,确保长时间任务的连续性。

5.3 多Agent协作

✅ 依赖关系管理

复杂任务可能需要多个子Agent协同工作,每个子Agent负责不同模块。Task工具中的依赖关系功能可以协调子Agent的工作顺序,避免冲突。

✅ 共享记忆

多Agent系统需要共享上下文或笔记。通过结构化笔记或内存工具,子Agent可以访问主任务的目标和进展,保持协调一致。

6 工具设计的核心原则

综合以上案例,可以总结出几个指导Agent工具设计的核心原则:

• 匹配模型能力:工具必须与模型的语言理解和推理能力相匹配。设计过于复杂的调用接口会导致模型混淆;过于简单则浪费潜力。

• 专用优于万能:全能工具看似灵活,但会增加模型决策负担;专用工具能提供明确的调用场景,帮助模型快速定位任务。

• 逐步披露信息:避免一次性将大量信息塞入上下文,用渐进式披露指导模型逐步探索。

• 主动构建上下文:提供搜索或grep等工具,让模型自行检索和构建上下文。被动喂食容易导致上下文失衡或过时。

• 持续迭代观察:工具设计不是一锤子买卖,需要持续观察模型输出并调整工具。随着模型能力提升,某些工具可能需要废弃或替换。

• 保持工具集精简:每添加一个工具都会增加模型选择成本。Anthropic保持约20个工具,并不断评估其必要性。

学AI大模型的正确顺序,千万不要搞错了

🤔2026年AI风口已来!各行各业的AI渗透肉眼可见,超多公司要么转型做AI相关产品,要么高薪挖AI技术人才,机遇直接摆在眼前!

有往AI方向发展,或者本身有后端编程基础的朋友,直接冲AI大模型应用开发转岗超合适!

就算暂时不打算转岗,了解大模型、RAG、Prompt、Agent这些热门概念,能上手做简单项目,也绝对是求职加分王🔋

在这里插入图片描述

📝给大家整理了超全最新的AI大模型应用开发学习清单和资料,手把手帮你快速入门!👇👇

学习路线:

✅大模型基础认知—大模型核心原理、发展历程、主流模型(GPT、文心一言等)特点解析
✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑
✅开发基础能力—Python进阶、API接口调用、大模型开发框架(LangChain等)实操
✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用
✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代
✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经

以上6大模块,看似清晰好上手,实则每个部分都有扎实的核心内容需要吃透!

我把大模型的学习全流程已经整理📚好了!抓住AI时代风口,轻松解锁职业新可能,希望大家都能把握机遇,实现薪资/职业跃迁~

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

在这里插入图片描述

Logo

小龙虾开发者社区是 CSDN 旗下专注 OpenClaw 生态的官方阵地,聚焦技能开发、插件实践与部署教程,为开发者提供可直接落地的方案、工具与交流平台,助力高效构建与落地 AI 应用

更多推荐