AI Agent 的开发框架层出不穷,开发者面临着框架选择的难题。本文基于项目文档的翻译整理,盘点当前几款主流的 AI Agent 开发框架:LangGraph、AutoGen、CrewAI、OpenAI Agents SDK、Google Agent Development Kit (ADK)、MetaGPT 和 PydanticAI。

学习这些 Agent 开发框架的设计思路,是一件很有意思的事情。例如 MetaGPT 模拟真实软件公司的角色分工与标准化流程 SOP,实现复杂任务的自动化处理。

LangGraph

LangGraph 是一种底层编排框架,用于构建、管理和部署长时间运行的有状态智能体。

  • 官网地址:https://www.langchain.com/langgraph
  • 项目地址:https://github.com/langchain-ai/langgraph

LangGraph 是由 LangChain 团队开发的开源框架,专为构建有状态、多步骤的复杂工作流而设计。它弥补了传统 LangChain 在动态流程控制(如循环、分支)上的不足,支持更灵活的 Agent 协作与状态管理:通过有向图(Graph) 组织工作流,将任务拆分为 节点(Nodes) 和 边(Edges),实现非线性的执行逻辑(如循环、条件分支),更贴近真实业务场景。

核心功能

LangGraph 为任何长时间运行的有状态工作流或智能体提供底层支撑性基础设施。LangGraph 不抽象化提示词或架构(不预设提示词模板,将控制权彻底交还开发者),提供以下核心优势:

  • 持久化执行(Durable execution):构建能够抵御故障并持续长时间运行的智能体,可从中断点精确自动恢复执行。
  • 人在回路(Human-in-the-loop):无缝整合人工监督,支持在执行过程中随时检查并修改智能体状态。
  • 全维度记忆管理(Comprehensive memory):创建真正有状态的智能体,兼具短期工作记忆(用于持续推理)和跨会话的长期持久记忆。
  • 基于 LangSmith 的调试(Debugging with LangSmith):通过可视化工具深入洞察复杂智能体行为:追踪执行路径、捕获状态迁移、提供详细运行时指标。
  • 生产级部署(Production-ready deployment):凭借专为有状态长时工作流设计的可扩展基础设施,自信部署复杂智能体系统
生态协同

LangGraph 可独立使用,也能与任何 LangChain 产品无缝集成,为开发者提供构建智能体的全套工具。为优化 LLM 应用开发,建议将 LangGraph 与以下组件结合使用:

  • LangSmith:专为智能体评估与可观测性设计。用于调试低效的 LLM 应用运行、评估智能体轨迹、实现生产环境可视化,并随时间推移提升性能。
  • LangGraph Platform:专为长时间运行的有状态工作流打造的部署平台,可轻松部署和扩展智能体。支持跨团队发现、复用、配置和共享智能体,并通过 LangGraph Studio 的可视化原型设计快速迭代。
  • LangChain:提供集成化、可组合的组件,以简化 LLM 应用开发流程。

在这里插入图片描述

AutoGen

在这里插入图片描述

AutoGen 是一个用于创建多智能体 AI 应用程序的框架,这些应用程序可以自主行动或与人类协同工作

  • 官网地址:https://www.microsoft.com/en-us/research/project/autogen/
  • 项目地址:https://github.com/microsoft/autogen

AutoGen 是由微软研究院开发的开源多智能体(Multi-Agent)协作框架,旨在通过大型语言模型(LLM)驱动多个 AI 智能体协同解决复杂任务。

核心特性
  • 异步消息传递:智能体间的异步消息通信
  • 模块化与可扩展性:可插拔组件,轻松定制系统
  • 可观测性与调试:对智能体交互和工作流的跟踪、追踪和调试
  • 分布式 :复杂、分布式的智能体网络
  • 内置和社区的扩展模块:允许开源开发者管理自己的扩展模块,增强了框架的功能
  • 跨语言支持:支持 Python 和 .NET
  • 完整类型支持:类型检查,确保代码的健壮性和内聚性
框架设计

AutoGen 采用分层且可扩展的设计:

  • Core API(核心 API):实现了消息传递、事件驱动的智能体(agents)以及本地和分布式运行时(runtime),以提供灵活性和强大功能。支持 .NET 和 Python 的跨语言操作。
  • AgentChat API(智能体聊天 API):在 Core API 之上构建,实现了一个更简单但带预设范式的 API,用于快速原型设计。此 API 构建于 Core API 之上,支持常见的多智能体模式。
  • Extensions API(扩展 API):支持第一方和第三方扩展,持续扩展框架能力。支持 LLM 客户端的具体实现(例如,OpenAI,AzureOpenAI)以及代码执行等能力。

AutoGen 生态系统还支持两个必备的开发者工具:

  • AutoGen Studio:提供无代码图形用户界面(GUI) 用于构建多智能体应用。
  • AutoGen Bench:提供用于评估智能体性能的基准测试套件。

CrewAI

在这里插入图片描述

CrewAI 是一个精简、极速的 Python 框架,完全从零开始构建——完全独立于 LangChain 或其他智能体框架。它使开发者能够同时获得高层次的简洁性和精确的低层次控制,是创建适用于任何场景的定制化自主 AI 智能体的理想选择。

  • 官网地址:https://www.crewai.com/
  • 项目地址:https://github.com/crewAIInc/crewAI
为什么需要 CrewAI

  • CrewAI Crews:针对多个智能体的自主性与协作智能进行优化。
  • CrewAI Flows:支持细粒度、事件驱动的控制,通过单次LLM调用实现精准任务编排,并原生支持Crews。

CrewAI 释放了多智能体自动化的真正潜力,通过 AI 智能体小组(Crews of AI Agents)或事件流程(Flows of Events),提供了顶尖水平的速度、灵活性和控制组合:

  1. 独立框架 (Standalone Framework):从零开始构建,独立于 LangChain 或任何其他智能体框架。
  2. 高性能 (High Performance):优化速度和最小资源使用,实现更快的执行。
  3. 灵活的低阶自定义 (Flexible Low Level Customization):完全自由地在高阶和低阶进行自定义——从整体工作流和系统架构,到细粒度的智能体行为、内部提示和执行逻辑。
  4. 适用于每种用例 (Ideal for Every Use Case):在简单任务和高度复杂的现实企业级场景中均被证明有效。
  5. 强大的社区 (Robust Community):由超过 100,000 名认证开发者组成的快速增长社区提供全面支持和资源。

CrewAI 使开发者和企业能够自信地构建智能自动化,弥合简洁性、灵活性和性能之间的差距

OpenAI Agents SDK

  • 官网地址:https://openai.github.io/openai-agents-python/
  • 项目地址:https://github.com/openai/openai-agents-python

OpenAI Agents SDK 是 Swarm 的生产优化版本,继承 Swarm 的核心设计理念(如多智能体协作、任务移交机制),同时新增关键生产级特性。

OpenAI Agents SDK 包含一组极简的核心原语

  1. 智能体(Agents),是配备指令和工具的大语言模型(LLM)
  2. 交接(Handoffs):允许智能体将特定任务委托给其他智能体
  3. 护栏(Guardrails):用于验证智能体的输入
  4. 会话(Sessions):自动维护跨智能体运行的对话历史
为什么需要 OpenAI Agents SDK

该 SDK 遵循两大设计原则:

  1. 功能丰富且概念精简:提供足够多的功能以体现使用价值,同时保持极简的核心原语,确保快速上手。
  2. 开箱即用且灵活定制:默认配置即可高效运行,同时支持精确自定义执行逻辑。

SDK 的主要特性包括:

  • 智能体循环(Agent loop):内置的智能体循环机制,自动处理工具调用、将结果返回给大语言模型(LLM)并持续循环,直至 LLM 完成任务。
  • Python 优先(Python-first):直接利用 Python 内置语言特性编排和串联智能体,无需学习新的抽象概念。
  • 交接机制(Handoffs):支持在多个智能体间协调与委派任务的核心功能。
  • 安全护栏(Guardrails):与智能体并行运行输入验证及检查,若检查失败则提前中断流程。
  • 会话管理(Sessions):自动维护跨智能体运行的对话历史,无需手动处理状态。
  • 函数工具(Function tools):将任意 Python 函数转化为工具,支持自动生成模式及 Pydantic 驱动的验证功能。
  • 追踪功能(Tracing):内置追踪系统,支持可视化、调试与监控工作流,并可结合 OpenAI 的评估、微调及模型蒸馏工具套件

Google Agent Development Kit (ADK)

  • 官网地址:https://google.github.io/adk-docs/
  • 项目地址:https://github.com/google/adk-python
  • 使用示例:https://github.com/google/adk-samples

Agent Development Kit (ADK) 是一个灵活、模块化的框架,用于开发和部署 AI 智能体。虽然针对 Gemini 和谷歌生态系统进行了优化,但 ADK 具备模型无关性(model-agnostic)和部署无关性(deployment-agnostic),并构建了与其他框架的兼容性。ADK 旨在使智能体开发更接近软件开发体验,帮助开发者更轻松地创建、部署和编排智能体架构——从简单任务到复杂工作流均可覆盖。

🌟 核心特性
  1. 健全工具生态(Rich Tool Ecosystem):使用预构建工具、自定义函数、OpenAPI规范或集成现有工具,赋予智能体多样化能力,实现与谷歌生态系统的深度整合。
  2. 代码驱动开发(Code-First Development):直接在Python中定义智能体逻辑、工具和编排机制,提供终极灵活性、可测试性和版本控制能力。
  3. 模块化多智能体系统(Modular Multi-Agent Systems):通过将多个专业化智能体组合成灵活层级结构,设计可扩展的应用系统。
  4. 随处部署(Deploy Anywhere):轻松将智能体容器化部署至Cloud Run,或通过Vertex AI智能体引擎实现无缝扩展。

ADK 还支持了与 Agent2Agent (A2A) 协议的集成,代码示例可阅读:https://github.com/a2aproject/a2a-samples/tree/main/samples/python/agents

MetaGPT

  • 官网地址:https://docs.deepwisdom.ai/main/en/
  • 项目地址:https://github.com/FoundationAgents/MetaGPT

为多个GPT分配不同角色,组成协作式软件实体以处理复杂任务。

MetaGPT 旨在通过模拟真实软件公司的角色分工与标准化流程(SOP),实现复杂任务的自动化处理。

将多智能体系统视作一个软件公司
  1. MetaGPT 接收单行需求作为输入,输出用户故事 / 竞品分析 / 需求文档 / 数据结构 / API / 文档等成果。
  2. MetaGPT 内部包含产品经理、架构师、项目经理、工程师等角色,提供软件公司的全流程及精心编排的标准化操作程序(SOP)。
  • Code = SOP(Team) 是核心哲学理念:将 SOP 具象化,并将其应用于由大语言模型(LLM)构成的团队协作中。

关于 MetaGPT 的核心概念,可以阅读文档:https://docs.deepwisdom.ai/main/en/guide/tutorials/concepts.html

  • 智能体(Agent)的定义:Agent = 大语言模型(LLM) + 观察(Observation) + 思考(Thought) + 行动(Action) + 记忆(Memory)
  • 多智能体系统(MultiAgent)的定义:MultiAgent = 智能体 + 环境 + 标准操作流程(SOP) + 通信 + 经济模型

PydanticAI

  • 官网地址:https://ai.pydantic.dev/
  • 项目地址:https://github.com/pydantic/pydantic-ai

PydanticAI 是一个 Python 智能体框架,旨在降低使用生成式人工智能(Generative AI)构建生产级应用程序的难度。

PydanticAI 是由 Pydantic 核心团队开发的 Python Agent 框架,旨在简化基于生成式 AI(如大语言模型 LLMs)的生产级应用开发。其设计灵感源自 FastAPI 的创新性与易用性,目标是提供类似 FastAPI 的开发体验,将 Pydantic 的强类型验证与现代化工具链深度结合,解决现有 LLM 开发框架的痛点。

为什么需要 PydanticAI
  1. 由 Pydantic 团队构建:由 Pydantic 背后的团队开发(该验证层已用于 OpenAI SDK、Anthropic SDK、LangChain、LlamaIndex、AutoGPT、Transformers、CrewAI、Instructor 等众多框架)。
  2. 模型无关性:支持 OpenAI、Anthropic、Gemini、Deepseek、Ollama、Groq、Cohere 和 Mistral,并提供简单接口以支持其他模型实现。
  3. Pydantic Logfire 集成:无缝集成 Pydantic Logfire,实现实时调试、性能监控及 LLM 应用行为追踪。
  4. 类型安全:旨在提供强大且信息丰富的类型检查。
  5. Python 风格设计:利用 Python 熟悉的控制流和智能体组合构建 AI 驱动项目,便于应用标准 Python 最佳实践(与非 AI 项目一致)。
  6. 结构化响应:利用 Pydantic 能力验证并结构化模型输出,确保响应结果跨运行的一致性。
  7. 依赖注入系统:提供可选的依赖注入系统,为智能体的系统提示、工具及输出验证器提供数据与服务,适用于测试和评估驱动的迭代开发。
  8. 流式响应:支持持续流式传输 LLM 响应,并即时验证,确保实时获取已验证输出

以上是几款智能体开发框架的介绍。

普通人如何抓住AI大模型的风口?

领取方式在文末

为什么要学习大模型?

目前AI大模型的技术岗位与能力培养随着人工智能技术的迅速发展和应用 , 大模型作为其中的重要组成部分 , 正逐渐成为推动人工智能发展的重要引擎 。大模型以其强大的数据处理和模式识别能力, 广泛应用于自然语言处理 、计算机视觉 、 智能推荐等领域 ,为各行各业带来了革命性的改变和机遇 。

目前,开源人工智能大模型已应用于医疗、政务、法律、汽车、娱乐、金融、互联网、教育、制造业、企业服务等多个场景,其中,应用于金融、企业服务、制造业和法律领域的大模型在本次调研中占比超过 30%。
在这里插入图片描述

随着AI大模型技术的迅速发展,相关岗位的需求也日益增加。大模型产业链催生了一批高薪新职业:
在这里插入图片描述

人工智能大潮已来,不加入就可能被淘汰。如果你是技术人,尤其是互联网从业者,现在就开始学习AI大模型技术,真的是给你的人生一个重要建议!

最后

只要你真心想学习AI大模型技术,这份精心整理的学习资料我愿意无偿分享给你,但是想学技术去乱搞的人别来找我!

在当前这个人工智能高速发展的时代,AI大模型正在深刻改变各行各业。我国对高水平AI人才的需求也日益增长,真正懂技术、能落地的人才依旧紧缺。我也希望通过这份资料,能够帮助更多有志于AI领域的朋友入门并深入学习。

真诚无偿分享!!!
vx扫描下方二维码即可
加上后会一个个给大家发

在这里插入图片描述

大模型全套学习资料展示

自我们与MoPaaS魔泊云合作以来,我们不断打磨课程体系与技术内容,在细节上精益求精,同时在技术层面也新增了许多前沿且实用的内容,力求为大家带来更系统、更实战、更落地的大模型学习体验。

图片

希望这份系统、实用的大模型学习路径,能够帮助你从零入门,进阶到实战,真正掌握AI时代的核心技能!

01 教学内容

图片

  • 从零到精通完整闭环:【基础理论 →RAG开发 → Agent设计 → 模型微调与私有化部署调→热门技术】5大模块,内容比传统教材更贴近企业实战!

  • 大量真实项目案例: 带你亲自上手搞数据清洗、模型调优这些硬核操作,把课本知识变成真本事‌!

02适学人群

应届毕业生‌: 无工作经验但想要系统学习AI大模型技术,期待通过实战项目掌握核心技术。

零基础转型‌: 非技术背景但关注AI应用场景,计划通过低代码工具实现“AI+行业”跨界‌。

业务赋能突破瓶颈: 传统开发者(Java/前端等)学习Transformer架构与LangChain框架,向AI全栈工程师转型‌。

image.png

vx扫描下方二维码即可
在这里插入图片描述

本教程比较珍贵,仅限大家自行学习,不要传播!更严禁商用!

03 入门到进阶学习路线图

大模型学习路线图,整体分为5个大的阶段:
图片

04 视频和书籍PDF合集

图片

从0到掌握主流大模型技术视频教程(涵盖模型训练、微调、RAG、LangChain、Agent开发等实战方向)

图片

新手必备的大模型学习PDF书单来了!全是硬核知识,帮你少走弯路(不吹牛,真有用)
图片

05 行业报告+白皮书合集

收集70+报告与白皮书,了解行业最新动态!
图片

06 90+份面试题/经验

AI大模型岗位面试经验总结(谁学技术不是为了赚$呢,找个好的岗位很重要)图片
在这里插入图片描述

07 deepseek部署包+技巧大全

在这里插入图片描述

由于篇幅有限

只展示部分资料

并且还在持续更新中…

真诚无偿分享!!!
vx扫描下方二维码即可
加上后会一个个给大家发

在这里插入图片描述

Logo

为武汉地区的开发者提供学习、交流和合作的平台。社区聚集了众多技术爱好者和专业人士,涵盖了多个领域,包括人工智能、大数据、云计算、区块链等。社区定期举办技术分享、培训和活动,为开发者提供更多的学习和交流机会。

更多推荐