大模型系列五：什么是AGENT，大模型入门到精通，收藏这篇就足够了！

Agent现在好多都翻译成“智能体”，可以将其视定义为一种应用程序，试图通过观察世界并利用其工具来实现目标。

人工智能小豪

222人浏览 · 2025-09-28 14:09:06

人工智能小豪 · 2025-09-28 14:09:06 发布

一、什么是Agent

Agent现在好多都翻译成“智能体”，可以将其视定义为一种应用程序，试图通过观察世界并利用其工具来实现目标。

但是现在很多人在提，这个翻译不是很准确，因为英文的原意是“代理人”的意思，所以在这种情景下，更像“代理”/“模拟”人去执行一些行为。Agent是自主的，可以在没有人干预的情况下独立行动，特别是当他们被赋予适当的目标或目的时。代理人还可以积极主动地实现他们的目标。即使在没有从人类那里获得显式指令集，代理可以推理出下一步应该做什么，并实现其最终目标。

二、Agent能带来什么？

使用Agent能带来很多新的变革能力，能将原来的人工智能带入新的时代，减少更多的人力投入。

自动化任务，提升效率。代替人工处理重复性、规则化的工作（如数据录入、文件整理等）。例如，客服聊天机器人自动回答常见问题，节省人工成本。
智能决策与复杂问题处理。通过算法分析数据，提供优化建议或自主决策。例如，金融交易代理实时分析市场趋势，自动执行买卖操作。
多任务协同与资源整合。无人工干预下协调不同系统或设备，实现跨平台操作。例如，企业级代理整合ERP、CRM系统，自动同步数据。

三、Agent的核心架构

在Google的Agent白皮书中，对Agent的核心组件做了明确的说明。下图就是《Googel Whitepaper Agents》中定义的“cognitive architecture 认识架构”，包括“Model”模型，“Tools”工具，“orchestration layer”编排层。

来自《Googel Whitepaper Agents》

The model 模型：模型便是指将常用用的大语言模型（LLM），是整个代理过程的决策者（大脑），模型基于指令进行推理和逻辑思考。可以通过Prompt和一些实例来完成训练代理完成一些特定任务，例如通过为代理提供展示其能力工具的示例来完成代理的任务，。

The tools 工具:模型类似于大脑，可以拟人思考，可以通过一些语言文本等类人沟通，但是就跟人类和动物的关键区别，就是能否使用工具。那么 Tools 工具就是使模型更接近人的一个关键能力，也弥合了无法与外界互动的差距。这种互动，在大模型中，通常是指与外部数据和服务进行交互，同时解锁更广泛的行动范围。例如与与常见的 Web API 方法，获取天气，新闻信息等。就跟科幻片里面，只通过语言告诉模型，就能用工具替人类做到一切。

The orchestration layer 编排层：编排层描述了一个循环过程，该过程规定了代理如何接收信息，进行一些内部推理，并利用这些推理来指导其下一步行动。

这里可以明确一下通常的模型和代理的关键区别：

四、另一个核心架构：

这是目前被引用最多的一篇文章《LLM Powered Autonomous Agents》，参考地址https://lilianweng.github.io/posts/2023-06-23-agent/ 她在其中提出来的Agent的核心架构如下：在LLM驱动的自主智能体系统中，以LLM作为智能体的大脑，并辅以多个关键组件：

Planning 规划：

• 子目标与分解：智能体将大型任务拆解为更小、可管理的子目标，从而高效处理复杂任务。

• 反思与优化：智能体能够对过往行动进行自检与反思，从错误中学习并优化后续步骤，进而提升最终结果的质量。

Memory 记忆：

• 短期记忆：所有上下文学习（见提示工程）均可视为利用模型的短期记忆进行学习。

• 长期记忆：通过外部向量存储与快速检索技术，赋予智能体长期保存和调用无限信息的能力。

Tools 工具使用：

智能体学习调用外部API，以获取模型权重中缺失的额外信息（通常预训练后难以修改），包括实时信息、代码执行能力、访问专有数据源等。

五、一个实际使用的例子：

在文心一言上传了一张图片，期望它能替我识别并翻译这张图片。但是没有给出任何指令，它自行推理出我的意图，并使用图片识别工具，识别图片中信息，并执行了识别。

六、一个使用LLM调用工具的代码示例：

这个是代码的学时序图解释，图已经很清楚了，就不在赘述。

上实际代码：

from
langchain_deepseek import ChatDeepSeek
##########创建DeepSeek的客户端
llm = ChatDeepSeek(
model="deepseek-chat",
temperature=0,
max_tokens=None,
timeout=None,
max_retries=2,
api_key="##########################################"
# other
params...
)
from
langchain_core.tools import tool
##########定义工具类
@tool
def add(a: int, b: int) -> int:
"""Adds
a and b."""
return a + b
@tool
def multiply(a: int, b: int) -> int:
"""Multiplies
a and b."""
return a * b
tools = [add, multiply]
##########绑定工具
llm_with_tools = llm.bind_tools(tools)
from
langchain_core.messages import HumanMessage
##########人类问题
query = "What is 3 * 12? Also, what is 11 + 49?"
messages =
[HumanMessage(query)]
ai_msg = llm_with_tools.invoke(messages)
##########大模型返回的需要调用的工具和参数
print(ai_msg.tool_calls)
#
[{'name': 'multiply', 'args': {'a': 3, 'b': 12}, 'id':
'call_0_3807dd23-8336-4bdd-85e2-cf3bc12d62e5', 'type': 'tool_call'}, {'name':
'add', 'args': {'a': 11, 'b': 49}, 'id':
'call_1_dd3d4e71-6e3f-43dc-841d-3bf8e58dedeb', 'type': 'tool_call'}]
messages.append(ai_msg)
print(messages)
#
[HumanMessage(content='What is 3 * 12? Also, what is 11 + 49?',
additional_kwargs={}, response_metadata={}), AIMessage(content='',
additional_kwargs={'tool_calls': [{'id':
'call_0_3807dd23-8336-4bdd-85e2-cf3bc12d62e5', 'function': {'arguments': '{"a":
3, "b": 12}', 'name': 'multiply'}, 'type': 'function', 'index': 0},
{'id': 'call_1_dd3d4e71-6e3f-43dc-841d-3bf8e58dedeb', 'function': {'arguments':
'{"a": 11, "b": 49}', 'name': 'add'}, 'type': 'function',
'index': 1}], 'refusal': None}, response_metadata={'token_usage':
{'completion_tokens': 48, 'prompt_tokens': 228, 'total_tokens': 276,
'completion_tokens_details': None, 'prompt_tokens_details': {'audio_tokens':
None, 'cached_tokens': 192}, 'prompt_cache_hit_tokens': 192,
'prompt_cache_miss_tokens': 36}, 'model_name': 'deepseek-chat',
'system_fingerprint': 'fp_3d5141a69a_prod0225', 'id':
'08ffe30f-b9bd-4d2c-a728-5f7b042faf7e', 'finish_reason': 'tool_calls',
'logprobs': None}, id='run-ab773720-51af-42ec-93eb-1c82ab4ebabb-0',
tool_calls=[{'name': 'multiply', 'args': {'a': 3, 'b': 12}, 'id':
'call_0_3807dd23-8336-4bdd-85e2-cf3bc12d62e5', 'type': 'tool_call'}, {'name':
'add', 'args': {'a': 11, 'b': 49}, 'id':
'call_1_dd3d4e71-6e3f-43dc-841d-3bf8e58dedeb', 'type': 'tool_call'}],
usage_metadata={'input_tokens': 228, 'output_tokens': 48, 'total_tokens': 276,
'input_token_details': {'cache_read': 192}, 'output_token_details': {}})]
##########执行工具调用并获取工具结果
for tool_call in ai_msg.tool_calls:
selected_tool = {"add": add, "multiply": multiply}[tool_call["name"].lower()]
tool_msg = selected_tool.invoke(tool_call)
messages.append(tool_msg)
messages
#
[HumanMessage(content='What is 3 * 12? Also, what is 11 + 49?',
additional_kwargs={}, response_metadata={}),
#
AIMessage(content='', additional_kwargs={'tool_calls': [{'id':
'call_0_3807dd23-8336-4bdd-85e2-cf3bc12d62e5', 'function': {'arguments':
'{"a": 3, "b": 12}', 'name': 'multiply'}, 'type':
'function', 'index': 0}, {'id': 'call_1_dd3d4e71-6e3f-43dc-841d-3bf8e58dedeb',
'function': {'arguments': '{"a": 11, "b": 49}', 'name':
'add'}, 'type': 'function', 'index': 1}], 'refusal': None},
response_metadata={'token_usage': {'completion_tokens': 48, 'prompt_tokens': 228,
'total_tokens': 276, 'completion_tokens_details': None,
'prompt_tokens_details': {'audio_tokens': None, 'cached_tokens': 192},
'prompt_cache_hit_tokens': 192, 'prompt_cache_miss_tokens': 36}, 'model_name':
'deepseek-chat', 'system_fingerprint': 'fp_3d5141a69a_prod0225', 'id':
'08ffe30f-b9bd-4d2c-a728-5f7b042faf7e', 'finish_reason': 'tool_calls',
'logprobs': None}, id='run-ab773720-51af-42ec-93eb-1c82ab4ebabb-0',
tool_calls=[{'name': 'multiply', 'args': {'a': 3, 'b': 12}, 'id':
'call_0_3807dd23-8336-4bdd-85e2-cf3bc12d62e5', 'type': 'tool_call'}, {'name':
'add', 'args': {'a': 11, 'b': 49}, 'id':
'call_1_dd3d4e71-6e3f-43dc-841d-3bf8e58dedeb', 'type': 'tool_call'}],
usage_metadata={'input_tokens': 228, 'output_tokens': 48, 'total_tokens': 276,
'input_token_details': {'cache_read': 192}, 'output_token_details': {}}),
#
ToolMessage(content='36', name='multiply',
tool_call_id='call_0_3807dd23-8336-4bdd-85e2-cf3bc12d62e5'),
#
ToolMessage(content='60', name='add',
tool_call_id='call_1_dd3d4e71-6e3f-43dc-841d-3bf8e58dedeb')]
##########将结果转换为人类语言
llm_with_tools.invoke(messages)
#
AIMessage(content='The result of \\(3 \\times 12\\) is \\(36\\),
and the result of \\(11 + 49\\) is \\(60\\).', additional_kwargs={'refusal': None},
response_metadata={'token_usage': {'completion_tokens': 28, 'prompt_tokens':
286, 'total_tokens': 314, 'completion_tokens_details': None,
'prompt_tokens_details': {'audio_tokens': None, 'cached_tokens': 256}, 'prompt_cache_hit_tokens':
256, 'prompt_cache_miss_tokens': 30}, 'model_name': 'deepseek-chat',
'system_fingerprint': 'fp_3d5141a69a_prod0225', 'id':
'0d010477-6223-412d-aae5-382013024828', 'finish_reason': 'stop', 'logprobs':
None}, id='run-5b8e40ed-2249-4b36-838a-a2c56b0e5cce-0',
usage_metadata={'input_tokens': 286, 'output_tokens': 28, 'total_tokens': 314,
'input_token_details': {'cache_read': 256}, 'output_token_details': {}})

七、后记

感觉一切的变革正在悄然进行，虽然没有创造出可以改变时代的工具的能力，但是跟随大师们的心是要有的。

想入门 AI 大模型却找不到清晰方向？备考大厂 AI 岗还在四处搜集零散资料？别再浪费时间啦！2025 年 AI 大模型全套学习资料已整理完毕，从学习路线到面试真题，从工具教程到行业报告，一站式覆盖你的所有需求，现在全部免费分享！

👇👇扫码免费领取全部内容👇👇

一、学习必备：100+本大模型电子书+26 份行业报告 + 600+ 套技术PPT，帮你看透 AI 趋势

想了解大模型的行业动态、商业落地案例？大模型电子书？这份资料帮你站在 “行业高度” 学 AI：

1. 100+本大模型方向电子书

在这里插入图片描述

2. 26 份行业研究报告：覆盖多领域实践与趋势

报告包含阿里、DeepSeek 等权威机构发布的核心内容，涵盖：

职业趋势：《AI + 职业趋势报告》《中国 AI 人才粮仓模型解析》；
商业落地：《生成式 AI 商业落地白皮书》《AI Agent 应用落地技术白皮书》；
领域细分：《AGI 在金融领域的应用报告》《AI GC 实践案例集》；
行业监测：《2024 年中国大模型季度监测报告》《2025 年中国技术市场发展趋势》。

3. 600+套技术大会 PPT：听行业大咖讲实战

PPT 整理自 2024-2025 年热门技术大会，包含百度、腾讯、字节等企业的一线实践：

在这里插入图片描述

安全方向：《端侧大模型的安全建设》《大模型驱动安全升级（腾讯代码安全实践）》；
产品与创新：《大模型产品如何创新与创收》《AI 时代的新范式：构建 AI 产品》；
多模态与 Agent：《Step-Video 开源模型（视频生成进展）》《Agentic RAG 的现在与未来》；
工程落地：《从原型到生产：AgentOps 加速字节 AI 应用落地》《智能代码助手 CodeFuse 的架构设计》。

二、求职必看：大厂 AI 岗面试 “弹药库”，300 + 真题 + 107 道面经直接抱走

想冲字节、腾讯、阿里、蔚来等大厂 AI 岗？这份面试资料帮你提前 “押题”，拒绝临场慌！

1. 107 道大厂面经：覆盖 Prompt、RAG、大模型应用工程师等热门岗位

面经整理自 2021-2025 年真实面试场景，包含 TPlink、字节、腾讯、蔚来、虾皮、中兴、科大讯飞、京东等企业的高频考题，每道题都附带思路解析：

2. 102 道 AI 大模型真题：直击大模型核心考点

针对大模型专属考题，从概念到实践全面覆盖，帮你理清底层逻辑：

3. 97 道 LLMs 真题：聚焦大型语言模型高频问题

专门拆解 LLMs 的核心痛点与解决方案，比如让很多人头疼的 “复读机问题”：

三、路线必明： AI 大模型学习路线图，1 张图理清核心内容

刚接触 AI 大模型，不知道该从哪学起？这份「AI大模型学习路线图」直接帮你划重点，不用再盲目摸索！

在这里插入图片描述

路线图涵盖 5 大核心板块，从基础到进阶层层递进：一步步带你从入门到进阶，从理论到实战。

L1阶段:启航篇丨极速破界AI新时代

L1阶段：了解大模型的基础知识，以及大模型在各个行业的应用和分析，学习理解大模型的核心原理、关键技术以及大模型应用场景。

L2阶段：攻坚篇丨RAG开发实战工坊

L2阶段：AI大模型RAG应用开发工程，主要学习RAG检索增强生成：包括Naive RAG、Advanced-RAG以及RAG性能评估，还有GraphRAG在内的多个RAG热门项目的分析。

L3阶段：跃迁篇丨Agent智能体架构设计

L3阶段：大模型Agent应用架构进阶实现，主要学习LangChain、 LIamaIndex框架，也会学习到AutoGPT、 MetaGPT等多Agent系统，打造Agent智能体。

L4阶段：精进篇丨模型微调与私有化部署

L4阶段：大模型的微调和私有化部署，更加深入的探讨Transformer架构，学习大模型的微调技术，利用DeepSpeed、Lamam Factory等工具快速进行模型微调，并通过Ollama、vLLM等推理部署框架，实现模型的快速部署。

L5阶段：专题集丨特训篇【录播课】

四、资料领取：全套内容免费抱走，学 AI 不用再找第二份

不管你是 0 基础想入门 AI 大模型，还是有基础想冲刺大厂、了解行业趋势，这份资料都能满足你！
现在只需按照提示操作，就能免费领取：

👇👇扫码免费领取全部内容👇👇

2025 年想抓住 AI 大模型的风口？别犹豫，这份免费资料就是你的 “起跑线”！

北京朝阳AI社区

更多推荐

一文掌握AI智能体八个必备核心概念,大模型入门到精通，收藏这篇就足够了！

北京朝阳AI社区

《探索 Agentic AI 智能教育创新应用的前沿奥秘，提示工程架构师揭秘》

当我们谈论“智能教育”时，很多人会想到“AI题库”“自动批改”或“个性化推荐”。但这些系统往往停留在“工具化”层面——它们能高效处理重复任务，却无法像人类教师那样理解学生的思维过程调整教学策略，或用有温度的互动激发学习兴趣。基于规则的“个性化推荐”，可能只会根据错题标签推送同类题目，却忽略了学生“为什么错”（是概念不清？还是计算失误？自动批改系统能标出错误，但无法用“学生能听懂的语言”解释“为什么