智能体架构

许多大型语言模型(LLM)应用在调用 LLM 之前或之后,都会遵循特定的控制流程。例如,检索增强生成(RAG)会检索与用户问题相关的文档,并将这些文档传递给 LLM,以便模型根据提供的文档上下文生成响应。

然而,有时我们不仅仅是硬编码一个固定的控制流程,而是希望 LLM 系统能够自主选择控制流程,以解决更复杂的问题。这便是“智能体”的定义之一:智能体是利用 LLM 来决定应用程序控制流程的系统。 LLM 可以通过多种方式控制应用程序的流程:

  • LLM 可以在两条潜在路径之间进行路由。
  • LLM 可以决定调用哪些工具。
  • LLM可以判断生成的答案是否足够,或者是否需要进一步工作。

因此,有许多不同类型的智能体架构,它们赋予 LLM 不同程度的控制能力。

智能体类型

路由器(Router)

路由器允许 LLM 从一组给定的选项中选择单个步骤。这种智能体架构的控制级别相对有限,因为LLM 通常专注于做出一个单一决策,并从有限的预定义选项中选择一个特定输出。路由器通常采用以下几种概念来实现这一功能:

结构化输出(Structured Output)

通过为 LLM 提供特定的格式或模式,要求其在响应中遵循,从而实现结构化输出。这类似于工具调用,但更具通用性。工具调用通常涉及选择和使用预定义函数,而结构化输出可用于任何类型的格式化响应。实现结构化输出的常见方法包括:

  1. 提示工程(Prompt Engineering): 通过系统提示(system prompt)指令 LLM 以特定格式响应。
  2. 输出解析器(Output Parsers): 使用后处理技术从 LLM 响应中提取结构化数据。
  3. 工具调用(Tool Calling): 利用某些 LLM 内置的工具调用能力来生成结构化输出。

结构化输出对于路由至关重要,因为它们确保 LLM 的决策可以被系统可靠地解释和执行。

工具调用智能体(Tool-calling Agent)

路由器允许 LLM 做出单一决策,而更复杂的智能体架构则通过两种关键方式扩展了 LLM 的控制能力:

  1. 多步骤决策(Multi-step decision making): LLM 可以连续做出系列决策,而不仅仅是一个。
  2. 工具访问(Tool access): LLM 可以选择并使用各种工具来完成任务。

ReAct 是一种流行的通用智能体架构,它结合了这些扩展,并整合了三个核心概念:

  1. 工具调用(Tool calling): 允许 LLM 根据需要选择和使用各种工具。
  2. 记忆(Memory): 使智能体能够保留并利用前一步骤的信息。
  3. **规划(Planning):**赋予 LLM 制定并遵循多步骤计划以实现目标的能力。

这种架构允许更复杂和灵活的智能体行为,超越了简单的路由,实现了多步骤的动态问题解决。与最初的 ReAct 论文不同,如今的智能体依赖于 LLM 的工具调用能力,并基于一系列消息进行操作。

在 LangGraph 中,你可以使用预构建的智能体来快速启动工具调用智能体。

工具调用(Tool Calling)

当您希望智能体与外部系统(例如 API)交互时,工具非常有用。外部系统通常需要特定的输入模式或载荷,而非自然语言。当我们将 API 绑定为工具时,模型就能了解所需的输入模式。模型会根据用户的自然语言输入选择调用工具,并返回符合工具所需模式的输出。

许多 LLM 提供商都支持工具调用。在 LangChain 中,工具调用接口很简单:您可以直接将任何 Python 函数 传递给 ChatModel.bind_tools(function)

工具

记忆(Memory)

记忆对于智能体至关重要,它使智能体能够在解决问题的多个步骤中保留和利用信息。记忆的作用范围不同:

  1. 短期记忆(Short-term memory): 允许智能体访问在序列早期步骤中获取的信息。
  2. 长期记忆(Long-term memory): 使智能体能够回忆起之前交互的信息,例如对话中的历史消息。

LangGraph 提供了对记忆实现方式的完全控制:

  • State 用户定义的模式,指定要保留的记忆的确切结构。
  • Checkpointer 一种机制,用于在会话中每一步存储状态,跨越不同的交互。
  • Store 一种机制,用于在不同会话中存储用户特定或应用程序级别的数据。

这种灵活的方法允许您根据特定的智能体架构需求定制记忆系统。有效的记忆管理增强了智能体保持上下文、从过去经验中学习以及随着时间做出更明智决策的能力。

规划(Planning)

在工具调用智能体中,LLM 会在一个循环中被反复调用。在每一步,智能体都会决定要调用哪些工具以及这些工具的输入应该是什么。然后执行这些工具,并将输出作为观察结果反馈给 LLM。当智能体判断它有足够的信息来解决用户请求,并且无需再调用任何工具时,循环终止。

自定义智能体架构

虽然路由器和工具调用智能体(如 ReAct)很常见,但定制智能体架构通常能针对特定任务带来更好的性能。LangGraph提供了几个强大的功能来构建定制的智能体系统:

人机协作(Human-in-the-loop)

人的参与可以显著提高智能体的可靠性,尤其是在处理敏感任务时。这可能包括:* 批准特定操作。

  • 提供反馈以更新智能体的状态。
  • 在复杂的决策过程中提供指导。

当完全自动化不可行或不可取时,人机协作模式至关重要。

###并行化(Parallelization)

并行处理对于高效的多智能体系统和复杂任务至关重要。LangGraph 通过其 Send API 支持并行化,从而实现:

  • 多个状态的并发处理。 *Map-Reduce 类似操作的实现。
  • 高效处理独立的子任务。

子图(Subgraphs)

子图对于管理复杂的智能体架构至关重要,特别是在多智能体系统中。它们允许:* 为单个智能体进行独立的状体管理。

  • 智能体团队的层次化组织。
  • 智能体与主系统之间受控的通信。

子图通过状态模式中重叠的键与父图进行通信。这使得灵活的模块化智能体设计成为可能。

反思(Reflection)

反思机制可以通过以下方式显著提高智能体的可靠性:

  1. 评估任务完成度和正确性。2. 提供反馈以进行迭代改进。
  2. 实现自我纠正和学习。

虽然反思通常基于 LLM,但也可以使用确定性方法。例如,在编程任务中,编译错误可以作为反馈。

通过利用这些功能,LangGraph 能够创建复杂的、针对特定任务的智能体架构,这些架构能够处理复杂的工作流程、有效地协作并持续提升

原文文档:https://langchain-ai.github.io/langgraph/concepts/agentic_concepts/

想入门 AI 大模型却找不到清晰方向?备考大厂 AI 岗还在四处搜集零散资料?别再浪费时间啦!2025 年 AI 大模型全套学习资料已整理完毕,从学习路线到面试真题,从工具教程到行业报告,一站式覆盖你的所有需求,现在全部免费分享

👇👇扫码免费领取全部内容👇👇

一、学习必备:100+本大模型电子书+26 份行业报告 + 600+ 套技术PPT,帮你看透 AI 趋势

想了解大模型的行业动态、商业落地案例?大模型电子书?这份资料帮你站在 “行业高度” 学 AI

1. 100+本大模型方向电子书

在这里插入图片描述

2. 26 份行业研究报告:覆盖多领域实践与趋势

报告包含阿里、DeepSeek 等权威机构发布的核心内容,涵盖:

  • 职业趋势:《AI + 职业趋势报告》《中国 AI 人才粮仓模型解析》;
  • 商业落地:《生成式 AI 商业落地白皮书》《AI Agent 应用落地技术白皮书》;
  • 领域细分:《AGI 在金融领域的应用报告》《AI GC 实践案例集》;
  • 行业监测:《2024 年中国大模型季度监测报告》《2025 年中国技术市场发展趋势》。

3. 600+套技术大会 PPT:听行业大咖讲实战

PPT 整理自 2024-2025 年热门技术大会,包含百度、腾讯、字节等企业的一线实践:

在这里插入图片描述

  • 安全方向:《端侧大模型的安全建设》《大模型驱动安全升级(腾讯代码安全实践)》;
  • 产品与创新:《大模型产品如何创新与创收》《AI 时代的新范式:构建 AI 产品》;
  • 多模态与 Agent:《Step-Video 开源模型(视频生成进展)》《Agentic RAG 的现在与未来》;
  • 工程落地:《从原型到生产:AgentOps 加速字节 AI 应用落地》《智能代码助手 CodeFuse 的架构设计》。

二、求职必看:大厂 AI 岗面试 “弹药库”,300 + 真题 + 107 道面经直接抱走

想冲字节、腾讯、阿里、蔚来等大厂 AI 岗?这份面试资料帮你提前 “押题”,拒绝临场慌!

1. 107 道大厂面经:覆盖 Prompt、RAG、大模型应用工程师等热门岗位

面经整理自 2021-2025 年真实面试场景,包含 TPlink、字节、腾讯、蔚来、虾皮、中兴、科大讯飞、京东等企业的高频考题,每道题都附带思路解析

2. 102 道 AI 大模型真题:直击大模型核心考点

针对大模型专属考题,从概念到实践全面覆盖,帮你理清底层逻辑:

3. 97 道 LLMs 真题:聚焦大型语言模型高频问题

专门拆解 LLMs 的核心痛点与解决方案,比如让很多人头疼的 “复读机问题”:


三、路线必明: AI 大模型学习路线图,1 张图理清核心内容

刚接触 AI 大模型,不知道该从哪学起?这份「AI大模型 学习路线图」直接帮你划重点,不用再盲目摸索!

在这里插入图片描述

路线图涵盖 5 大核心板块,从基础到进阶层层递进:一步步带你从入门到进阶,从理论到实战。

img

L1阶段:启航篇丨极速破界AI新时代

L1阶段:了解大模型的基础知识,以及大模型在各个行业的应用和分析,学习理解大模型的核心原理、关键技术以及大模型应用场景。

img

L2阶段:攻坚篇丨RAG开发实战工坊

L2阶段:AI大模型RAG应用开发工程,主要学习RAG检索增强生成:包括Naive RAG、Advanced-RAG以及RAG性能评估,还有GraphRAG在内的多个RAG热门项目的分析。

img

L3阶段:跃迁篇丨Agent智能体架构设计

L3阶段:大模型Agent应用架构进阶实现,主要学习LangChain、 LIamaIndex框架,也会学习到AutoGPT、 MetaGPT等多Agent系统,打造Agent智能体。

img

L4阶段:精进篇丨模型微调与私有化部署

L4阶段:大模型的微调和私有化部署,更加深入的探讨Transformer架构,学习大模型的微调技术,利用DeepSpeed、Lamam Factory等工具快速进行模型微调,并通过Ollama、vLLM等推理部署框架,实现模型的快速部署。

img

L5阶段:专题集丨特训篇 【录播课】

img
四、资料领取:全套内容免费抱走,学 AI 不用再找第二份

不管你是 0 基础想入门 AI 大模型,还是有基础想冲刺大厂、了解行业趋势,这份资料都能满足你!
现在只需按照提示操作,就能免费领取:

👇👇扫码免费领取全部内容👇👇

2025 年想抓住 AI 大模型的风口?别犹豫,这份免费资料就是你的 “起跑线”!

Logo

更多推荐