什么是 Agent?

“Agent” 这个概念,不同用户有着不同理解。在 Anthropic,我们将这些不同的形态都归类为 Agent 系统,但我们在架构上对 WorkFlowAgent 做了区分:

  • WorkFlow:通过预定义代码路径来编排大语言模型和工具的系统
  • Agent:LLM 能够动态指导自身流程和工具使用,自主决定如何完成任务的系统

接下来我们将详细探讨这两种 Agent 系统。

何时使用以及何时避免使用 Agent

在构建大语言模型应用时,我们建议优先寻找最简单的解决方案,只在必要的时候增加复杂度,这意味着很多时候我们根本不需要构建 Agent 。Agent 系统通常能提升任务表现,但是会在延迟和成本上会有所增加,所以我们需要仔细评估这种牺牲是否值得。

当我们确实需要更复杂方案时,WorkFlow 能为明确定义的任务提供可预测性和一致性,而 Agent 则在需要灵活性和模型驱动决策的规模化场景中表现更好。对大多数应用来说,通过检索和上下文示例来优化单次大语言模型调用通常就足够了。

框架的适用场景与使用方法

现在有很多种框架可以简化 Agent 系统的实现,包括:

  • LangChain 的 LangGraph
  • Amazon Bedrock 的 AI Agent 框架
  • Rivet,一个拖拽式 GUI 大语言模型 WorkFlow 构建器
  • 以及 Vellum,另一个用于构建和测试复杂 WorkFlow 的 GUI 工具

这些框架简化了大预言模型的调用、工具定义和链式调用等底层任务,降低了入门门槛。但这些框架会引入额外抽象层,而且它们可能会隐藏底层的提示词,会导致调试难度的增加。更重要的是,它们可能导致你在简单方案就能满足需求时过度设计。

我们建议开发者从直接使用大语言模型的 API 开始上手,因为很多模式只需几行代码就能实现。如果确实要使用框架,请务必理解它的底层原理——对底层实现的理解偏差是用户遇到问题的常见原因。

基础模块、WorkFlow与 Agent

本节将探讨在生产环境中常见的 Agent 系统模式。我们将从基础模块——增强型大语言模型开始,逐步深入,从简单的组合WorkFlow到完全自主的 Agent。

基础模块:增强型 LLM

Agent 系统的基础模块是配备了检索、工具和记忆等增强功能的 LLM。我们当前的模型能够主动运用这些能力——自主生成搜索查询、选择合适的工具,并决定需要保留哪些信息。

在这里插入图片描述

我们建议大家重点关注两个点:

  1. 根据具体的用例去定制开发这些功能
  2. 确保它们为大语言模型提供足够简单、且文档完善的接口。

虽然实现方式有很多种,但我们最近发布的 模型上下文协议 MCP 提供了一种更好方案,让开发者通过简单的 客户端实现 集成丰富的第三方工具生态。

提示链 WorkFlow

提示词链将任务分解为一系列步骤,每个大语言模型调用处理前一个调用的输出。你可以在中间任何一个步骤加入程序化的检查(见下图的"关卡"),确保流程不偏离正轨。

在这里插入图片描述

适用场景:当任务能清晰拆分为固定子任务时,这种 WorkFlow 是理想的选择。其主要目标是通过让每个大语言模型调用执行更简单的任务,以延迟换取更高准确性。

实用案例

  • 生成营销文案后翻译成其他语言
  • 撰写文档大纲→检查是否符合标准→基于大纲完成正文

路由型 WorkFlow

路由对输入进行分类并引导至专门的后续任务。这种 WorkFlow 实现了关注点分离,便于构建更专业的提示词。没有它,优化某一类输入可能会影响其他类型的处理效果。

适用场景:适用于那种业务场景明显不同、且需要单独处理的复杂任务,分类可以通过大语言模型或传统分类模型/算法准确完成。

实用案例

  • 将客服查询(常规问题、退款请求、技术支持)分流到不同的处理流程和工具
  • 简单问题路由到 Claude 3.5 Haiku,复杂问题路由到 Claude 3.5 Sonnet,优化成本与速度

并行化 WorkFlow

LLM 可以同时处理任务,并通过程序化方式聚合输出。并行化WorkFlow主要有两种形式:

  • 分段:将任务拆分为独立的子任务并行执行
  • 投票:多次执行相同任务以获得多样化输出

img

适用场景:当子任务可并行加速,或需要多个视角、多次尝试以获得高置信度结果时特别有效。对于需要多重考量的复杂任务,让每个大语言模型调用专注处理特定方面通常效果更好。

实用案例

  • 分段
  • 防护栏机制:一个模型处理查询,另一个筛查不当内容
  • LLM 性能自动化评估,不同调用评估不同维度
  • 投票
  • 多提示词并行审查代码漏洞
  • 多维度评估内容合规性,设置不同投票阈值平衡误判

协调器-工作者 WorkFlow

在这个WorkFlow中,协调器大语言模型动态分解任务,分配给工作者 LLM,并综合处理结果。

适用场景:适合无法预知所需子任务的复杂场景(如编码任务中,需修改的文件数量和内容因任务而异)。关键区别在于灵活性——子任务由协调器根据输入动态决定。

实用案例

  • 需要跨多个文件进行复杂修改的编码任务
  • 从多源搜集分析信息的搜索任务

评估器-优化器 WorkFlow

一个大语言模型调用生成响应,另一个在循环中提供评估和反馈。

img

评估器-优化器WorkFlow

适用场景:当有清晰评估标准且迭代优化能带来显著价值时特别有效。适合的标志是:人工反馈能明显改善大语言模型响应,且大语言模型能提供此类反馈。这类似于人类作者的迭代写作过程。

实用案例

  • 文学翻译,评估器指出译者忽略的细微差别
  • 需要多轮搜索分析的复杂信息搜集任务

Agent

随着大语言模型理解复杂输入、推理规划、可靠使用工具和错误恢复等关键能力的成熟,Agent 正逐步应用于生产环境。Agent 从接收人类指令或交互讨论开始,任务明确后便自主规划运行,期间可能返回寻求更多信息或判断。执行过程中,Agent 通过工具调用结果、代码执行等环境反馈来评估进展,可在检查点(Check Point)或遇到阻碍时暂停等待人工反馈。任务通常在完成时结束,但同时也会设置最大迭代次数等停止条件以保持控制。

Agent 虽然能处理复杂任务,但其实现方式往往较为简单——通常只是大语言模型在循环中根据环境反馈使用工具。因此,精心设计工具集和文档至关重要。附录2(“工具的提示词工程”)将详细探讨工具开发的最佳实践。

适用场景:适用于开放式问题,这类问题难以预测步骤数且无法固定路径。LLM 可能运行多轮,你需要一定程度信任其决策。自主性使 Agent 适合受信任环境中的规模化任务。

但自主性也意味着更高成本和错误累积风险。建议在沙盒环境中充分测试,并设置适当防护措施。

实用案例(来自我们的实践):

  • 解决 SWE-bench 任务 的编码 Agent,根据描述修改多个文件
  • “计算机使用” 参考实现,Claude 操作计算机完成任务

模式的组合与定制

这些模块不是固定的规则,而是可以根据用例调整的模式。与其他大预言模型的功能一样,成功关键在于持续测量性能并迭代优化。再次强调:只有当增加复杂性能显著改善结果时,你才应该考虑这么做。

总结

在大语言模型领域取得成功,关键不是构建最复杂的系统,而是构建 最适合 需求的系统。从简单提示词起步,通过全面评估进行优化,仅当 简单方案不足时才引入多步骤 Agent 系统。

实现 Agent 时,我们遵循三个核心原则:

  1. 保持设计 简洁
  2. 通过展示规划步骤确保流程 透明
  3. 通过完善的 文档和测试 精心设计 Agent-计算机接口

框架能助你快速起步,但在生产环境中,不妨减少抽象层,用基础组件构建。遵循这些原则,你就能创建出不仅强大,而且可靠、可维护、值得用户信任的 Agent。

普通人如何抓住AI大模型的风口?

领取方式在文末

为什么要学习大模型?

目前AI大模型的技术岗位与能力培养随着人工智能技术的迅速发展和应用 , 大模型作为其中的重要组成部分 , 正逐渐成为推动人工智能发展的重要引擎 。大模型以其强大的数据处理和模式识别能力, 广泛应用于自然语言处理 、计算机视觉 、 智能推荐等领域 ,为各行各业带来了革命性的改变和机遇 。

目前,开源人工智能大模型已应用于医疗、政务、法律、汽车、娱乐、金融、互联网、教育、制造业、企业服务等多个场景,其中,应用于金融、企业服务、制造业和法律领域的大模型在本次调研中占比超过 30%。
在这里插入图片描述

随着AI大模型技术的迅速发展,相关岗位的需求也日益增加。大模型产业链催生了一批高薪新职业:
在这里插入图片描述

人工智能大潮已来,不加入就可能被淘汰。如果你是技术人,尤其是互联网从业者,现在就开始学习AI大模型技术,真的是给你的人生一个重要建议!

最后

只要你真心想学习AI大模型技术,这份精心整理的学习资料我愿意无偿分享给你,但是想学技术去乱搞的人别来找我!

在当前这个人工智能高速发展的时代,AI大模型正在深刻改变各行各业。我国对高水平AI人才的需求也日益增长,真正懂技术、能落地的人才依旧紧缺。我也希望通过这份资料,能够帮助更多有志于AI领域的朋友入门并深入学习。

真诚无偿分享!!!
vx扫描下方二维码即可
加上后会一个个给大家发

在这里插入图片描述

大模型全套学习资料展示

自我们与MoPaaS魔泊云合作以来,我们不断打磨课程体系与技术内容,在细节上精益求精,同时在技术层面也新增了许多前沿且实用的内容,力求为大家带来更系统、更实战、更落地的大模型学习体验。

图片

希望这份系统、实用的大模型学习路径,能够帮助你从零入门,进阶到实战,真正掌握AI时代的核心技能!

01 教学内容

图片

  • 从零到精通完整闭环:【基础理论 →RAG开发 → Agent设计 → 模型微调与私有化部署调→热门技术】5大模块,内容比传统教材更贴近企业实战!

  • 大量真实项目案例: 带你亲自上手搞数据清洗、模型调优这些硬核操作,把课本知识变成真本事‌!

02适学人群

应届毕业生‌: 无工作经验但想要系统学习AI大模型技术,期待通过实战项目掌握核心技术。

零基础转型‌: 非技术背景但关注AI应用场景,计划通过低代码工具实现“AI+行业”跨界‌。

业务赋能突破瓶颈: 传统开发者(Java/前端等)学习Transformer架构与LangChain框架,向AI全栈工程师转型‌。

image.png

vx扫描下方二维码即可
在这里插入图片描述

本教程比较珍贵,仅限大家自行学习,不要传播!更严禁商用!

03 入门到进阶学习路线图

大模型学习路线图,整体分为5个大的阶段:
图片

04 视频和书籍PDF合集

图片

从0到掌握主流大模型技术视频教程(涵盖模型训练、微调、RAG、LangChain、Agent开发等实战方向)

图片

新手必备的大模型学习PDF书单来了!全是硬核知识,帮你少走弯路(不吹牛,真有用)
图片

05 行业报告+白皮书合集

收集70+报告与白皮书,了解行业最新动态!
图片

06 90+份面试题/经验

AI大模型岗位面试经验总结(谁学技术不是为了赚$呢,找个好的岗位很重要)图片
在这里插入图片描述

07 deepseek部署包+技巧大全

在这里插入图片描述

由于篇幅有限

只展示部分资料

并且还在持续更新中…

真诚无偿分享!!!
vx扫描下方二维码即可
加上后会一个个给大家发

在这里插入图片描述

Logo

更多推荐