收藏！构建高效AI Agent的完整指南：从WorkFlow到Agent，一篇搞定

Anthropic官方介绍了如何构建高效的AI Agent，区分了WorkFlow和Agent的不同应用场景。文章建议优先使用简单方案，仅在必要时增加复杂度，并详细介绍了基础模块、各种WorkFlow模式以及Agent的实现方法。成功关键在于持续测量性能并迭代优化，遵循保持设计简洁、确保流程透明、精心设计接口三大原则。框架能降低入门门槛，但理解底层原理至关重要，只有当简单方案不足时才引入多步骤Ag

ai绘画-安安妮

921人浏览 · 2025-10-09 11:37:52

ai绘画-安安妮 · 2025-10-09 11:37:52 发布

什么是 Agent？

“Agent” 这个概念，不同用户有着不同理解。在 Anthropic，我们将这些不同的形态都归类为 Agent 系统，但我们在架构上对 WorkFlow 和 Agent 做了区分：

WorkFlow：通过预定义代码路径来编排大语言模型和工具的系统
Agent：LLM 能够动态指导自身流程和工具使用，自主决定如何完成任务的系统

接下来我们将详细探讨这两种 Agent 系统。

何时使用以及何时避免使用 Agent

在构建大语言模型应用时，我们建议优先寻找最简单的解决方案，只在必要的时候增加复杂度，这意味着很多时候我们根本不需要构建 Agent 。Agent 系统通常能提升任务表现，但是会在延迟和成本上会有所增加，所以我们需要仔细评估这种牺牲是否值得。

当我们确实需要更复杂方案时，WorkFlow 能为明确定义的任务提供可预测性和一致性，而 Agent 则在需要灵活性和模型驱动决策的规模化场景中表现更好。对大多数应用来说，通过检索和上下文示例来优化单次大语言模型调用通常就足够了。

框架的适用场景与使用方法

现在有很多种框架可以简化 Agent 系统的实现，包括：

LangChain 的 LangGraph
Amazon Bedrock 的 AI Agent 框架
Rivet，一个拖拽式 GUI 大语言模型 WorkFlow 构建器
以及 Vellum，另一个用于构建和测试复杂 WorkFlow 的 GUI 工具

这些框架简化了大预言模型的调用、工具定义和链式调用等底层任务，降低了入门门槛。但这些框架会引入额外抽象层，而且它们可能会隐藏底层的提示词，会导致调试难度的增加。更重要的是，它们可能导致你在简单方案就能满足需求时过度设计。

我们建议开发者从直接使用大语言模型的 API 开始上手，因为很多模式只需几行代码就能实现。如果确实要使用框架，请务必理解它的底层原理——对底层实现的理解偏差是用户遇到问题的常见原因。

基础模块、WorkFlow与 Agent

本节将探讨在生产环境中常见的 Agent 系统模式。我们将从基础模块——增强型大语言模型开始，逐步深入，从简单的组合WorkFlow到完全自主的 Agent。

基础模块：增强型 LLM

Agent 系统的基础模块是配备了检索、工具和记忆等增强功能的 LLM。我们当前的模型能够主动运用这些能力——自主生成搜索查询、选择合适的工具，并决定需要保留哪些信息。

在这里插入图片描述

我们建议大家重点关注两个点：

根据具体的用例去定制开发这些功能
确保它们为大语言模型提供足够简单、且文档完善的接口。

虽然实现方式有很多种，但我们最近发布的模型上下文协议 MCP 提供了一种更好方案，让开发者通过简单的客户端实现集成丰富的第三方工具生态。

提示链 WorkFlow

提示词链将任务分解为一系列步骤，每个大语言模型调用处理前一个调用的输出。你可以在中间任何一个步骤加入程序化的检查（见下图的"关卡"），确保流程不偏离正轨。

在这里插入图片描述

适用场景：当任务能清晰拆分为固定子任务时，这种 WorkFlow 是理想的选择。其主要目标是通过让每个大语言模型调用执行更简单的任务，以延迟换取更高准确性。

实用案例：

生成营销文案后翻译成其他语言
撰写文档大纲→检查是否符合标准→基于大纲完成正文

路由型 WorkFlow

路由对输入进行分类并引导至专门的后续任务。这种 WorkFlow 实现了关注点分离，便于构建更专业的提示词。没有它，优化某一类输入可能会影响其他类型的处理效果。

适用场景：适用于那种业务场景明显不同、且需要单独处理的复杂任务，分类可以通过大语言模型或传统分类模型/算法准确完成。

实用案例：

将客服查询（常规问题、退款请求、技术支持）分流到不同的处理流程和工具
简单问题路由到 Claude 3.5 Haiku，复杂问题路由到 Claude 3.5 Sonnet，优化成本与速度

并行化 WorkFlow

LLM 可以同时处理任务，并通过程序化方式聚合输出。并行化WorkFlow主要有两种形式：

分段：将任务拆分为独立的子任务并行执行
投票：多次执行相同任务以获得多样化输出

img

适用场景：当子任务可并行加速，或需要多个视角、多次尝试以获得高置信度结果时特别有效。对于需要多重考量的复杂任务，让每个大语言模型调用专注处理特定方面通常效果更好。

实用案例：

分段：

防护栏机制：一个模型处理查询，另一个筛查不当内容
LLM 性能自动化评估，不同调用评估不同维度

投票：

多提示词并行审查代码漏洞
多维度评估内容合规性，设置不同投票阈值平衡误判

协调器-工作者 WorkFlow

在这个WorkFlow中，协调器大语言模型动态分解任务，分配给工作者 LLM，并综合处理结果。

适用场景：适合无法预知所需子任务的复杂场景（如编码任务中，需修改的文件数量和内容因任务而异）。关键区别在于灵活性——子任务由协调器根据输入动态决定。

实用案例：

需要跨多个文件进行复杂修改的编码任务
从多源搜集分析信息的搜索任务

评估器-优化器 WorkFlow

一个大语言模型调用生成响应，另一个在循环中提供评估和反馈。

img

评估器-优化器WorkFlow

适用场景：当有清晰评估标准且迭代优化能带来显著价值时特别有效。适合的标志是：人工反馈能明显改善大语言模型响应，且大语言模型能提供此类反馈。这类似于人类作者的迭代写作过程。

实用案例：

文学翻译，评估器指出译者忽略的细微差别
需要多轮搜索分析的复杂信息搜集任务

Agent

随着大语言模型理解复杂输入、推理规划、可靠使用工具和错误恢复等关键能力的成熟，Agent 正逐步应用于生产环境。Agent 从接收人类指令或交互讨论开始，任务明确后便自主规划运行，期间可能返回寻求更多信息或判断。执行过程中，Agent 通过工具调用结果、代码执行等环境反馈来评估进展，可在检查点（Check Point）或遇到阻碍时暂停等待人工反馈。任务通常在完成时结束，但同时也会设置最大迭代次数等停止条件以保持控制。

Agent 虽然能处理复杂任务，但其实现方式往往较为简单——通常只是大语言模型在循环中根据环境反馈使用工具。因此，精心设计工具集和文档至关重要。附录2（“工具的提示词工程”）将详细探讨工具开发的最佳实践。

适用场景：适用于开放式问题，这类问题难以预测步骤数且无法固定路径。LLM 可能运行多轮，你需要一定程度信任其决策。自主性使 Agent 适合受信任环境中的规模化任务。

但自主性也意味着更高成本和错误累积风险。建议在沙盒环境中充分测试，并设置适当防护措施。

实用案例（来自我们的实践）：

解决 SWE-bench 任务的编码 Agent，根据描述修改多个文件
“计算机使用” 参考实现，Claude 操作计算机完成任务

模式的组合与定制

这些模块不是固定的规则，而是可以根据用例调整的模式。与其他大预言模型的功能一样，成功关键在于持续测量性能并迭代优化。再次强调：只有当增加复杂性能显著改善结果时，你才应该考虑这么做。

总结

在大语言模型领域取得成功，关键不是构建最复杂的系统，而是构建 最适合 需求的系统。从简单提示词起步，通过全面评估进行优化，仅当简单方案不足时才引入多步骤 Agent 系统。

实现 Agent 时，我们遵循三个核心原则：

保持设计简洁
通过展示规划步骤确保流程透明
通过完善的 文档和测试 精心设计 Agent-计算机接口

框架能助你快速起步，但在生产环境中，不妨减少抽象层，用基础组件构建。遵循这些原则，你就能创建出不仅强大，而且可靠、可维护、值得用户信任的 Agent。

普通人如何抓住AI大模型的风口？

领取方式在文末

为什么要学习大模型？

目前AI大模型的技术岗位与能力培养随着人工智能技术的迅速发展和应用，大模型作为其中的重要组成部分，正逐渐成为推动人工智能发展的重要引擎。大模型以其强大的数据处理和模式识别能力，广泛应用于自然语言处理、计算机视觉、智能推荐等领域，为各行各业带来了革命性的改变和机遇。

目前，开源人工智能大模型已应用于医疗、政务、法律、汽车、娱乐、金融、互联网、教育、制造业、企业服务等多个场景，其中，应用于金融、企业服务、制造业和法律领域的大模型在本次调研中占比超过 30%。
在这里插入图片描述

随着AI大模型技术的迅速发展，相关岗位的需求也日益增加。大模型产业链催生了一批高薪新职业：
在这里插入图片描述

人工智能大潮已来，不加入就可能被淘汰。如果你是技术人，尤其是互联网从业者，现在就开始学习AI大模型技术，真的是给你的人生一个重要建议！

最后

只要你真心想学习AI大模型技术，这份精心整理的学习资料我愿意无偿分享给你，但是想学技术去乱搞的人别来找我！

在当前这个人工智能高速发展的时代，AI大模型正在深刻改变各行各业。我国对高水平AI人才的需求也日益增长，真正懂技术、能落地的人才依旧紧缺。我也希望通过这份资料，能够帮助更多有志于AI领域的朋友入门并深入学习。

真诚无偿分享！！！
vx扫描下方二维码即可
加上后会一个个给大家发
在这里插入图片描述

大模型全套学习资料展示

自我们与MoPaaS魔泊云合作以来，我们不断打磨课程体系与技术内容，在细节上精益求精，同时在技术层面也新增了许多前沿且实用的内容，力求为大家带来更系统、更实战、更落地的大模型学习体验。

希望这份系统、实用的大模型学习路径，能够帮助你从零入门，进阶到实战，真正掌握AI时代的核心技能！

01 教学内容

从零到精通完整闭环：【基础理论 →RAG开发 → Agent设计 → 模型微调与私有化部署调→热门技术】5大模块，内容比传统教材更贴近企业实战！
大量真实项目案例： 带你亲自上手搞数据清洗、模型调优这些硬核操作，把课本知识变成真本事‌！

02适学人群

应届毕业生‌： 无工作经验但想要系统学习AI大模型技术，期待通过实战项目掌握核心技术。

零基础转型‌： 非技术背景但关注AI应用场景，计划通过低代码工具实现“AI+行业”跨界‌。

业务赋能突破瓶颈： 传统开发者（Java/前端等）学习Transformer架构与LangChain框架，向AI全栈工程师转型‌。

vx扫描下方二维码即可
在这里插入图片描述

本教程比较珍贵，仅限大家自行学习，不要传播！更严禁商用！

03 入门到进阶学习路线图

大模型学习路线图，整体分为5个大的阶段：

04 视频和书籍PDF合集

从0到掌握主流大模型技术视频教程（涵盖模型训练、微调、RAG、LangChain、Agent开发等实战方向）

新手必备的大模型学习PDF书单来了！全是硬核知识，帮你少走弯路（不吹牛，真有用）

05 行业报告+白皮书合集

收集70+报告与白皮书，了解行业最新动态！

06 90+份面试题/经验

AI大模型岗位面试经验总结（谁学技术不是为了赚$呢，找个好的岗位很重要）
在这里插入图片描述

07 deepseek部署包+技巧大全

在这里插入图片描述

由于篇幅有限

只展示部分资料

并且还在持续更新中…

真诚无偿分享！！！
vx扫描下方二维码即可
加上后会一个个给大家发
在这里插入图片描述

北京朝阳AI社区

更多推荐

IBM（国际商业机器公司）---ChatGPT 5 thinking作答

常被称作**“蓝色巨人 / Big Blue”软件、咨询、基础架构融资混合云 + 人工智能（AI）量子计算**与企业级安全。其前身是（Computing-Tabulating-Recording Co.），1911 年成立，1924 年更名为 IBM；如今的业务重心与四大分部见 10-K/年报说明。

北京朝阳AI社区

PyTorch 详细学习笔记第十六章：参数高效训练与大模型技巧

摘要本章探讨了参数高效训练与大模型优化技术。核心内容包括：1）参数高效微调(PEFT)方法如LoRA和Adapter，通过仅训练少量参数实现高效微调；2）梯度检查点技术以计算换显存；3）FSDP/ZeRO思想实现分布式训练的显存优化。文章提供了LoRA的具体实现代码示例，并分析了不同优化技术的适用场景和组合策略，为在有限资源下训练大模型提供了系统性解决方案。