什么是 AI 智能体
大语言模型的浪潮推动了 AI Agent 相关研究快速发展,AI Agent 是当前通往 AGI 的主要探索路线。大模型让 AI 会思考,而 Agent 让思考能落地"——这正是Deepseek等平台正在构建的下一代智能基础设施。
【DeepSeek应用】Deepseek R1 本地部署(Ollama+Docker+OpenWebUI)
【DeepSeek应用】DeepSeek 搭建个人知识库(Ollama+CherryStudio)
【DeepSeek应用】Deepseek 构建 AI Agent(CherryStudio +MCP)
构建 AI Agent
大语言模型的浪潮推动了 AI Agent 相关研究快速发展,AI Agent 是当前通往 AGI 的主要探索路线。
“大模型让 AI 会思考,而 Agent 让思考能落地”——这正是Deepseek等平台正在构建的下一代智能基础设施。
1. 什么是 AI Agent?
比尔.盖茨在《AI is about to completely change how you use computers》一文中探讨了 AI Agent 对未来生活的巨大影响,展望了 AI Agent 在医疗保健、教育、生产力、娱乐和购物等领域的作用。AI Agent 将为人们提供更个性化的服务,帮助解决各种问题并提供支持,从辅助医生和教师工作到处理日常任务,甚至影响我们与朋友和家人的互动方式。AI Agent 正在以各种方式迅速进入我们的生活,将在未来几年内彻底改变我们的生活方式。
人工智能代理(AI Agent)也称智能代理、智能体,是一种结合大型语言模型(LLM)的推理与决策能力,以及现实世界交互工具的人工智能系统。不同于 LLM 的简单文本生成,AI Agent 被赋予特定的角色,拥有不同程度的自主性,具备感知环境、决策行动的能力,能有效简化工作流程、降低人力投入和沟通障碍,极大地提升效率与协作水平。
让我们看一个并不复杂的分析文案写作任务:“请帮我分析上月销售数据,找出增长最快的区域,并对比竞品动态生成报告。”
如果直接使用 Deepseek 来写,处理过程是这样的:
如果用 Deepseek + AI Agent 来做,其处理过程为:
GPT 或 Deepseek 这类大语言模型(LLM)虽然性能强大,但如果只有 LLM 而没有 Agent,就像给一个博学的分析师配备了一个没有手脚和工具的大脑——它能理解任务,却无法执行。
要解决这样的具体任务,就需要**大语言模型(LLM)与人工智能代理(AI Agent)**的精密协作: AI Agent 调用 LLM,自动提取数据库、调用分析工具、交叉验证市场数据,最后返回一份结构清晰的报告——无需人工干预。
这就是 AI Agent 与大模型的区别。它们不再是简单应答的聊天机器人,而是具备自主感知、决策与执行能力的智能体。从自动化流程到复杂问题求解,AI Agent 正在重塑人机协作的边界。
2. AI Agent 基础知识
2.1 AI Agent 的定义
Agent 模型是人工智能专业术语,指的是具有自主性、反应性、主动性和社交能力等特性的计算实体。这种实体能够使用传感器感知周围环境,做出决策,然后使用执行器采取行动。Agent 模型在 AI Agent 相关研究中得到了快速发展,被视为通往人工通用智能(AGI)的主要探索路线。
AI Agent(人工智能代理)是一种能够自主感知环境、制定决策并执行行动的智能系统。与传统的程序不同,AI Agent具备:
- 目标导向性:以完成特定任务为驱动(如"生成竞品分析报告")
- 环境交互能力:通过API、传感器或用户输入获取信息
- 自主决策权:在不确定条件下选择最优路径(如数据缺失时切换数据源)
- 持续学习:从历史交互中优化策略
2.2 AI Agent 的分类
吴恩达提出将 AI Agent 分为反思、工具、计划、多智能体四类。
-
反思系统(Reflection system)
通过自我反思方式,帮助模型不断改进输出质量的编排系统。这种方法模仿人类在完成任务时的思考和修正过程,使模型推理能力更强,结果更可靠。
这种编排系统特别适合输出高质量的文案,例如 AI Agent 编写文案。Grammarly 平台就是利用编排系统,调用强大的AI大模型进行写作,同时它不断反思检查你的拼写、语法和标点符号,通过多模型提供的句子结构和语言流畅性的建议进一步优化输出更好的效果。 -
工具调用系统(Tool Calling)
让大语言模型在生成答案或解决问题的过程中,调用外部工具(如计算器、数据库、搜索引擎等),以完成自身无法直接处理的任务。
大语言模型本身只提供文本的生成和回答,工具调用系统可以通过调用工具弥补大语言模型的不足,扩展模型的功能。 -
计划系统(Planning)
在解决复杂问题时,为实现目标制定合理的步骤或行动计划的能力。让大模型在面对复杂任务时,能像人一样制定计划、分解问题、逐步执行。
这种AI Agent就像我们人类一样把大问题拆分成小问题,并制定计划解决。这种方式更贴近真实智能的行为,可以处理广泛复杂任务。例如 Image Describer X 图片描述网站,在处理图片时会使用模型制定计划。 -
多智能体系统(Multi-Cast Multi Agent)
复杂的 Agent系统,利用多个 Agent 智能体,在共同目标的指导下,通过分工、协作和交互来完成任务或解决问题的过程。
例如 ChatDev (Chat-powered Software Development) 是大模型驱动的全流程自动化软件开发框架 。在人类“用户”指定一个具体的任务需求后,不同角色的智能体将进行交互式协同,包括产品智能体设计方案,UI智能体设计界面,程序员智能体实现效果,测试智能体评估代码来生产一个完整软件(包括源代码、环境依赖说明书、用户手册等)。
2.3 AI Agent 的架构与模块
- 基本架构
基于经典的 PEAS 架构,一个完整的 AI Agent 需要具备四大核心能力:
-
Performance(目标)
指 Agent 的终极任务指标,例如 “生成准确率>95%的竞品对比报告”。 -
Environment(环境)
指 Agent 操作的数据与工具生态,例如 CRM系统、第三方数据API、Excel/Python工具链。
针对众多和不同的需求,产生了各种各样的 AI Agent 环境,具有不同的类型和特性。 -
Actuators(执行器)
指 Agent 的行动手段,例如 API调用、代码执行、邮件自动发送。 -
Sensors(感知器)
指 Agent 的信息输入渠道,例如 用户指令解析、数据库查询结果、网页爬取数据。
- 工作流程
与人类处理复杂任务类似,AI Agent 关键的工作流程包括感知、决策和执行。
-
感知(Perception)
通过处理文本、语音、图像或其他感官输入,从环境中收集和提取信息。
例如,使用文本、语音和计算机视觉来识别用户输入,感知环境信息。 -
决策(Planning)
根据可用数据,为实现某一目标而做出决策和规划,确定最佳作方案。
例如,根据用户的问题规划回答的思路、确定需要调用的工具或知识资源等。 -
执行(Action)
根据环境和决策方案,执行各种具体任务。
例如,回答用户的问题、执行特定的任务(如查询数据库、调用外部 API 等),或与其他 Agent 进行交互。
- 核心模块
AI Agent 由多个模块(组件)组成,这些模块协同工作以分析数据、做出的决策并有效地执行任务。工程实现中的核心模块包括:
-
规划模块(Planning):
规划模块具有事前规划和事后反思能力。事前规划是对行动的预测和制定决策,将大目标拆分为更小的可管理的子任务,通过将任务细化,从而能够高效地规划一系列步骤或行动。事后反思是对计划和行动的检查和改进,从错误中学习并在后续步骤里完善,从而改善最终结果的质量。 -
记忆模块(Memory):
记忆模块负责存储信息,包括过去的交互、学习到的知识,甚至是临时的任务信息,包括短期记忆和长期记忆。
短期记忆(Short-term memory):存储当前的上下文交互的关键信息。
长期记忆(Long-term memory):存储大量的知识和经验,可以在后续任务中检索和召回。 -
工具模块(Tools):
利用外部资源或工具来执行任务、扩展功能,通过调用不同的 API或工具,完成复杂任务和输出高质量结果,例如计算器、搜索引擎、数据库等。 -
执行模块(Action):
智能体实际执行决定或响应的具体操作。面对不同的任务,智能体系统有一个完整的行动策略集,在决策时可以选择需要执行的行动,比如广为熟知的记忆检索、推理、学习、编程等。
来自:Lilian Weng, LLM Powered Autonomous Agents(https://lilianweng.github.io/posts/2023-06-23-agent)
3. AI Agent 构建平台
随着 AI Agent 技术的快速发展,国内外各大厂商和开源社区纷纷推出了各种 Agent 构建平台和框架。这些 Agent 正在悄然改变人们的工作方式,提高工作与生产效率,以及重新定义生产力。
一方面大模型都在推出集成插件的“可执行能思考”的Chatbot版本,另一方面Agent构建平台正在成为大语言模型厂商的产品标配。
3.1 AI Agent 构建平台的工作方式
AI Agent 构建平台是专门设计用于定制、开发和部署 AI Agent 的平台或框架。
AI Agent 所能完成的任务取决于 Agent 开发平台提供的 Agent 功能扩展,包括通过知识库实现检索增强、插件及API实现工具调用、工作流实现复杂任务执行、数据库实现信息读写等。利用这些功能扩展,AI Agent 就能综合运用各种工具,完成各类任务。
目前主流的 AI Agent 构建平台,从产品 UI 界面到产品功能逻辑都很相似,提供基于 LLM 能力支持的简单 Agent (如对话机器人)和 复杂 Agent(集成工作流、知识库、API 插件)构建两种方式。
在创建 Agent 应用时,用户只需要输入项目名称和项目描述,就能自动生成智能体的名称、头像、简介及系统提示词等内容,快捷、方便地配置好智能体。
-
基于LLM构建简单 Agent
基于LLM通识能力,快速构建 chatbot
适用场景: 适用于仅需 LLM 通识能力,通过设定 LLM 的系统提示词(人设&工作内容&温度值等参数)就可以实现业务需求的场景,如“美食推荐专家”、“智能沟通专家”、“冷笑话专家”、“知识百科小助手”等等。 -
基于知识库&插件&工作流,构建复杂智能体
适用场景:
如果需要访问企业/个人知识库、或调用一些额外的API插件来实现业务需求,则需要配置好相应的插件(如网络爬虫API、xxx数据库查询与数据统计API、天气查询API、航班查询API等等)、知识库数据库访问API等。 -
工作流
如果有更复杂的需求,例如需要根据不同的业务触发条件执行对应的 SOP,则还需要配置工作流。
很多 Agent 平台都提供了 “画布拖拽式” 的工作流搭建功能。在你设计的工作流中,可以选择让 LLM 参与或不参与任务,此时LLM 就相当于一个组件。
3.2 海外 AI Agent 构建平台
https://github.com/e2b-dev/awesome-ai-agents
部分 AI Agent 平台介绍如下,更多信息详见:Github:e2b-dev,王吉伟频道
-
GPTs Builder:OpenAI于首届开发者大会上推出了自定义GPT功能,可添加知识、操作和说明,并发布以供其他人使用。
-
AIAgent.app ,一个 Web应用,它根据你设定的目标自行做出选择和执行任务。
-
firsthand.ai,为品牌和出版商打造的AI Agent平台
-
Beam.ai,在Agent流程自动化平台上构建自定义Agent,帮助团队提高生产力并自动化耗时的业务流程。
-
Kompas.ai,提供可立即部署的 AI Agent,用于复杂多样的业务任务,通过快速响应、无缝的 Google 搜索集成和简单的 AI 训练来提高工作效率。
-
Synthflow.ai,前身为Fine-Tuner.AI,现为一个部署响应速度超快的语音Agent的无代码平台
-
AgentRunner.ai,一款 AI 自动化软件,允许用户创建自主AI Agent来自动执行复杂任务并实时监控性能。
-
Agent.so,为用户提供对话和训练AI Agent的平台。
-
lyzr.ai,最简单的Agent框架,可更快地构建“私密和安全”的GenAI应用程序,“即插即用”Agent,为企业自动化复杂的工作流程
-
agenta.ai,多合一的 LLM 开发人员平台:及时管理、评估、人工反馈和部署都集中在一个地方。
-
Voiceflow.com,可帮助对话式 AI 团队更快地构建和启动适用于任何用例的令人难以置信的AI Agent。
-
gptbots.ai,让每个人都能构建AI Bot的无代码平台,用于创建AI驱动的商业应用程序,具备Flow编排、多模态、Agents和Plugins等能力,一个指令即可让多Agents协同工作。
-
亚马逊Bedrock Agent:帮助开发者构建AI Agent和知识库,简化了应用程序开发过程。
-
Relevance AI,打造您的AI员工队伍.轻松培训和部署您的AI员工
-
YIVAL,非程序员可以轻松、经济且快速地创建定制的AI Agent。
-
BrainSoup,制作自定义Agent完成日常任务与复杂任务,用Agent彻底改变工作流程。
-
HeyAI,一个使用生成式AI构建的AI Agent系统,可以定制以满足用户特定业务需求,可以智能化大规模自动化业务的任务、流程和工作流程。
-
brevian.ai,借助BREVIAN的无代码平台,企业用户可以构建定制的、安全的AI Agent。
-
agentx.so,基于GPT4、Gemini 或 Anthropic等LLM,使用您自己的数据创建多模型AI Agent。
-
Dataloop.ai,提供专门设计的工具,可轻松大规模创建和启动企业级AI Agent。
-
Steamship,一个用于构建AI Agent的平台,设计简单易用,可以构建复杂的Agent。使用Python SDK构建AI Agent并部署到云中,访问无服务器云托管、矢量搜索、Webhook、回调等。
-
OutSystems AI Agent Builder,OutSystems发布的AI Agent构建平台,是一种无代码工具,用于使用 Azure OpenAI 或 Amazon Bedrock 中的大型语言模型构建自定义生成式 AI Agent。能够自定义AI Agent开发、“快速入门”生成式AI应用和模板库、由检索增强生成 (RAG) 提供支持的AI Agent。
-
Nexus AI Agent Builder,构建和集成自定义AI Agent,在几分钟内自动执行任何工作流程,无需编写代码。
-
Vertex AI Agent Builder,谷歌云推出的AI Agent构建平台,使用自然语言或代码优先的方法创建AI Agent。通过一系列选项,轻松使用企业数据为Agent提供依据。Vertex AI Agent Builder 是 Vertex AI Search and Conversation 的扩展版和更换后的品牌名。
-
UBOS是一个支持人工智能应用程序的开发、部署和管理的综合平台,提供包括Telegram、ChatGPT等在内大厂广泛的集成,以帮助开发人员创建强大且交互式的AI Agent。UBOS还提供了一个工作流自动化工作室,可简化设计和管理 AI 工作流的过程。
-
Taskade Custom AI Agents,专门设计AI Agent的工具,旨在自动执行研究、任务管理和内容创造等例行活动。
-
Sierra AI Agent OS,一个使用AI进行推理、决策和对话的软件系统,借助 Agent OS企业可以利用有关自主Agent的最新研究,以及使AI对企业安全的独特功能。
-
Cimba.ai,使用自然语言使用特定于业务的知识和逻辑训练AI Agent,将其转换为针对您的业务需求量身定制的专用工具。
-
Insighto.AI,一个无需编程的AI Agent构建平台,它使用户能够创建、自定义和部署聊天机器人。
-
ibl.ai,使用自己的数据、提示词、工作流、guardrails和 UI/UX 创建聊天机器人、Agent和copilot。
-
Stork.ai提供了一个Agent Builder平台,允许用户在不需要编码知识的情况下自动化各个部门例如销售和市场营销的工作流程。
-
youai.ai,快速构建自定义 AI 应用程序和自动化,无需编码,轻松混合和匹配来自 OpenAI、Anthropic、Google、Mistral、Meta 等的最新模型。
-
Askgen,创建个性化ChatGPTAgent,在任何地方用自己的数据进行训练并应用,使用现有数据创建AI Agent的最简单方法。
-
AgentRunner,一个帮助创建和训练AI Agent的工具,使用了GPT-4,无需编程技能。
-
AgentGPT,通过AgentGPT创建AI Agent非常简单,只需要命名您的Agent,并决定一个能够捕捉Agent本质的独特名称。
-
Synthflow.AI,一个提供高度定制的人声模仿对话AI Agent的平台,用户无需长时间的开发周期或昂贵的机器学习团队,便能够构建复杂且定制化的AI Agent。
-
Promptly,构建量身定制的生成式AI Agent、应用程序和聊天机器人,以满足用户的独特需求。无缝集成数据和GPT驱动的模型,无需任何编码经验。
-
Wonderchat,根据指定的链接和文件,5分钟内构建ChatGPT驱动的机器人。
-
Agentcrew,一个用于构建 AI Agent和多Agent系统的平台,以自动执行任何任务。
-
MindPal,一个用于建立AI Agent团队的平台,这些团队基本上可以充当用户AI“第二大脑”,旨在执行特定任务,有助于提高生产力和任务管理。
-
Algomo,一个专注于通过AI技术改善客户服务体验的平台。通过构建自主AI Agent,为客户服务领域带来了创新解决方案。
-
Lindy,一个用于构建自己的AI Agent无代码平台,帮助用户完成从电子邮件和日历管理到客户支持,销售和招聘等任务。提供3000+开箱即用的集成,并支持基于事件的触发器和跨Agent协作。
-
Retell AI,一个快速构建人性化会话语音AI的平台,它使用大型语言模型(LLM)进行操作,可以帮助开发者在几分钟内创建出富有会话能力的语音AI Agent。
-
Moveo.AI,使用最先进的NLP、生成式AI和内部企业级LLM创建AI Agent。上传聊天记录、知识库、网站和文档,毫不费力地实现超过70%的客户支持操作和流程的自动化。
-
Respell,一个无代码AI平台,旨在通过组合简单的AI模型构建块来帮助用户创建工作流程。结合了无代码工作流、由Agent驱动的聊天体验以及建议功能,让用户可以像操作魔法一样轻松使用AI。
-
Thesamur.ai,Camel AGI的官方Agent构建平台,可以根据用户的数据进行训练并创建一个由ChatGPT提供支持的AI聊天机器人。
-
airscale.ai,在数据上大规模构建AI工作流和Agent。通过可扩展的工作流和Agent简化AI操作,在各种开源和闭源LLM中进行选择或自带模型,加载数据并像AI驱动的电子表格一样轻松大规模运行。
-
MindOS,一个自主AI Agent平台,用户可以设计自己的AI Agent并将其无缝集成到日常生活或业务中,通过各种AI服务和功能改善个人和企业的生活与工作效率。
-
Back4app,Back4App Agent是一种自主AI工具,可帮助开发人员构建、部署和排除应用程序故障,简化DevOps任务并提高云运营效率。只需几个提示,用户即可在几分钟内创建可扩展的云架构。
-
Rivet,Ironclad推出的一个可视化编程环境,用于使用LLM构建AI Agent。在Rivet中迭代提示图,然后直接在应用程序中运行它们。借助 Rivet,团队可以有效地设计、调试和协作处理复杂的 LLM 提示图,并将它们部署在自己的环境中。
-
Fetch.ai是一个面向AI经济的技术公司和平台,它提供了一套工具,帮助用户构建、部署和盈利化AI服务。无需更改现有API改造遗留系统,通过面向AI Agent的开放网络,将服务发布于Fetch.ai平台。
-
Sheri.ai,一个创新的平台,旨在通过人工智能简化并个性化LLM应用的构建和共享过程。
-
anakin.ai,一站式AI应用平台,内容创作、文案、问答、图像生成、视频生成、语音生成、智能Agent、自动化工作流、自定义AI 应用都能能胜任,自由定制专属AI应用。
-
FlowiseAI,开源低代码工具,供开发人员构建自定义的LLM 编排流程和AI Agent,非常容易构建LLM应用程序。
-
Respond,收集客户信息并使用AI Agent构建器配置AI Agent,以实现业务目标。同时处理多个对话提高效率,腾出人工代理来执行更复杂的任务
-
Aizzy,由AIZ代币提供支持的开放、公平和全球可访问的人去中心化的人工智能生态系统。
-
Botesonic,将您的数据转换为自我指导、自我学习的AI Agent。
-
Chatwith,添加内容和数据源,与您的服务集成,训练自定义聊天机器人成为您的专家AI Agent,无需代码,几分钟即可准备就绪。
-
MyShell,构建、共享和拥有AI Agent,构建连接用户、创作者和开源AI 研究人员的AI消费者层。
-
Chatbot Builder AI,为您的网站、社交媒体、电子邮件和电话构建自定义聊天机器人和GPT 的最快、最简单的方法。
-
Retool,使用预构建的块将AI即时集成到您的应用程序和工作流程中。使用任何模型,安全地连接业务数据,并更快地将定制的AI工具交付到您的业务,构建有效的AI应用。
-
Appstorm.ai,一个允许用户将想法转变为交互式移动应用程序的平台。旨在使个人、企业和创作者能够轻松创建GPT应用程序,而不需要任何技术知识。
-
Chatbot App,一个由AI驱动的聊天机器人工具,该工具集成了ChatGPT、GPT-4和Google PalM2等技术,为用户提供写作帮助、创意生成和解决创意障碍的解决方案。
-
GoCharlie.ai,一家专注于生成性人工智能的公司,其Agent Charlie是一个AI Agent构建程序,帮助企业开发认知Agent,以优化各个商业环节。
-
FlowiseAI,一个拖放式平台,旨在制作 LLM流程和创建LangChain应用程序。用户能够构建各种应用程序,包括聊天机器人、虚拟助手、数据分析工具和AI Agent。
-
Langflow,一种从简单到复杂的AI应用程序(AI Agent)构建的简单方法。它是一个低代码平台,允许用户将AI集成到所做的一切。
-
Galadon,一款网站 AI 工具,无需编码添加AI 功能,具有即用型设计和简单的拖放系统,用户友好,可以轻松创建AI 应用程序,用于制作内容或实时翻译等任务。
-
Magicflow,一个无代码工具,旨在使构建AI工作流程变得容易。拖放式平台可让用户快速创建和测试AI工作流程,无需复杂的基础设施工作,将AI工作流程集成到应用程序中变得简单。
3.3 国内 AI Agent 构建平台
国内的 AI Agent 构建平台也正在呈现百花齐放的盛况。百度、字节跳动、阿里巴巴、科大讯飞等大语言模型的厂商都推出了 AI Agent 构建平台。
- 文心智能体平台,百度推出的基于文心大模型的 Agent 平台,支持开发者根据自身行业领域、应用场景,选取不同类型的开发方式。
- 扣子(Coze),字节跳动推出的一个AI聊天机器人和应用程序编辑开发平台,可以创建类GPTs机器人,该产品还有海外版。
支持无代码生成 AI Bot,集成了插件工具集,可以帮助用户快速搭建、发布基于大模型的各类 AI 应用。
- 腾讯元器,腾讯混元大模型团队推出的智能体创作工具,可以通过添加提示词设定、插件、知识库等功能制作智能体。
- 智谱清言,智谱推出的生成式AI助手,可以构建智能体,在工作、学习和日常生活中为用户解答各类问题,完成各种任务。
- Dify.AI:一个LLM应用开发平台,支持超过10万个应用的构建,集成了Backend as Service和LLMOps的理念,适用于构建生成式AI原生应用,主打基于任何LLM创建AI Agent。
-
飞书智能伙伴:字节跳动旗下在线办公品牌飞书的AI产品,是一个开放的 AI 服务框架”,支持多款大模型以及用户自定义构建智能伙伴。
-
钉钉AI助理,一款智能化工具,汇集了钉钉的AI产品能力,企业用户和个人用户可以根据需求创建个性化AI助理。
-
AskXBOT,澜码科技发布的企业级AI Agent平台,集Agent与工作流设计、开发、使用、管理于一体。
-
Vanus AI,帮助企业链接大模型和构建知识库,进行提示词(prompt engineering)调试,搭建企业的AI应用(AI Agent)。
-
Gnomic智能体平台,一个AI Agent多模态平台,旨在为个人和企业提供多样化的智能体服务,支持多模态的AI Agent创作,帮助用户快速设计和训练个性化的智能体。
小结:国内的 AI agent 平台中,扣子、文心智能体、千帆AppBuilder 的 Agent能力支撑较为完备,Dify 也有很好的 Agent能力扩展,FastGPT 在知识库方面具有独特优势,腾讯元器正在快速完善功能,智谱智能体侧重于对话类Agent,天工SkyAgents、讯飞星火智能体平台在插件市场方面存在短板。
版权声明:
youcans@qq.com 原创作品,转载必须标注原文链接:
【DeepSeek应用】Deepseek 构建 AI Agent
Copyright@youcans 2025
Crated:2025-04
更多推荐
所有评论(0)