一、什么是Agent

Agent现在好多都翻译成“智能体”,可以将其视定义为一种应用程序,试图通过观察世界并利用其工具来实现目标。

但是现在很多人在提,这个翻译不是很准确,因为英文的原意是“代理人”的意思,所以在这种情景下,更像“代理”/“模拟”人去执行一些行为。Agent是自主的,可以在没有人干预的情况下独立行动,特别是当他们被赋予适当的目标或目的时。代理人还可以积极主动地实现他们的目标。即使在没有从人类那里获得显式指令集,代理可以推理出下一步应该做什么,并实现其最终目标。

二、Agent能带来什么?

使用Agent能带来很多新的变革能力,能将原来的人工智能带入新的时代,减少更多的人力投入。

  1. 自动化任务,提升效率。代替人工处理重复性、规则化的工作(如数据录入、文件整理等)。例如,客服聊天机器人自动回答常见问题,节省人工成本。

  2. 智能决策与复杂问题处理。通过算法分析数据,提供优化建议或自主决策。例如,金融交易代理实时分析市场趋势,自动执行买卖操作。

  3. 多任务协同与资源整合。无人工干预下协调不同系统或设备,实现跨平台操作。例如,企业级代理整合ERP、CRM系统,自动同步数据。

三、Agent的核心架构

在Google的Agent白皮书中,对Agent的核心组件做了明确的说明。下图就是《Googel Whitepaper Agents》中定义的“cognitive architecture 认识架构”,包括“Model”模型,“Tools”工具,“orchestration layer”编排层。

来自《Googel Whitepaper Agents》

The model 模型:模型便是指将常用用的大语言模型(LLM),是整个代理过程的决策者(大脑),模型基于指令进行推理和逻辑思考。可以通过Prompt和一些实例来完成训练代理完成一些特定任务,例如通过为代理提供展示其能力工具的示例来完成代理的任务,。

The tools 工具:模型类似于大脑,可以拟人思考,可以通过一些语言文本等类人沟通,但是就跟人类和动物的关键区别,就是能否使用工具。那么 Tools 工具就是使 模型更接近人的一个关键能力,也弥合了无法与外界互动的差距。这种互动,在大模型中,通常是指与外部数据和服务进行交互,同时解锁更广泛的行动范围。例如与与常见的 Web API 方法,获取天气,新闻信息等。就跟科幻片里面,只通过语言告诉模型,就能用工具替人类做到一切。

The orchestration layer 编排层:编排层描述了一个循环过程,该过程规定了代理如何接收信息,进行一些内部推理,并利用这些推理来指导其下一步行动。

这里可以明确一下通常的模型和代理的关键区别:

四、另一个核心架构:

这是目前被引用最多的一篇文章《LLM Powered Autonomous Agents》,参考地址https://lilianweng.github.io/posts/2023-06-23-agent/ 她在其中提出来的Agent的核心架构如下:在LLM驱动的自主智能体系统中,以LLM作为智能体的大脑,并辅以多个关键组件:

Planning 规划:

• 子目标与分解:智能体将大型任务拆解为更小、可管理的子目标,从而高效处理复杂任务。

• 反思与优化:智能体能够对过往行动进行自检与反思,从错误中学习并优化后续步骤,进而提升最终结果的质量。

Memory 记忆:

• 短期记忆:所有上下文学习(见提示工程)均可视为利用模型的短期记忆进行学习。

• 长期记忆:通过外部向量存储与快速检索技术,赋予智能体长期保存和调用无限信息的能力。

Tools 工具使用:

智能体学习调用外部API,以获取模型权重中缺失的额外信息(通常预训练后难以修改),包括实时信息、代码执行能力、访问专有数据源等。

五、一个实际使用的例子:

在文心一言上传了一张图片,期望它能替我识别并翻译这张图片。但是没有给出任何指令,它自行推理出我的意图,并使用图片识别工具,识别图片中信息,并执行了识别。

六、一个使用LLM调用工具的代码示例:

这个是代码的学时序图解释,图已经很清楚了,就不在赘述。

上实际代码:

from
langchain_deepseek import ChatDeepSeek
##########创建DeepSeek的客户端
llm = ChatDeepSeek(
model="deepseek-chat",
temperature=0,
max_tokens=None,
timeout=None,
max_retries=2,
api_key="##########################################"
# other
params...
)
from
langchain_core.tools import tool
##########定义工具类
@tool
def add(a: int, b: int) -> int:
"""Adds
a and b."""
return a + b
@tool
def multiply(a: int, b: int) -> int:
"""Multiplies
a and b."""
return a * b
tools = [add, multiply]
##########绑定工具
llm_with_tools = llm.bind_tools(tools)
from
langchain_core.messages import HumanMessage
##########人类问题
query = "What is 3 * 12? Also, what is 11 + 49?"
messages =
[HumanMessage(query)]
ai_msg = llm_with_tools.invoke(messages)
##########大模型返回的需要调用的工具和参数
print(ai_msg.tool_calls)
#
[{'name': 'multiply', 'args': {'a': 3, 'b': 12}, 'id':
'call_0_3807dd23-8336-4bdd-85e2-cf3bc12d62e5', 'type': 'tool_call'}, {'name':
'add', 'args': {'a': 11, 'b': 49}, 'id':
'call_1_dd3d4e71-6e3f-43dc-841d-3bf8e58dedeb', 'type': 'tool_call'}]
messages.append(ai_msg)
print(messages)
#
[HumanMessage(content='What is 3 * 12? Also, what is 11 + 49?',
additional_kwargs={}, response_metadata={}), AIMessage(content='',
additional_kwargs={'tool_calls': [{'id':
'call_0_3807dd23-8336-4bdd-85e2-cf3bc12d62e5', 'function': {'arguments': '{"a":
3, "b": 12}', 'name': 'multiply'}, 'type': 'function', 'index': 0},
{'id': 'call_1_dd3d4e71-6e3f-43dc-841d-3bf8e58dedeb', 'function': {'arguments':
'{"a": 11, "b": 49}', 'name': 'add'}, 'type': 'function',
'index': 1}], 'refusal': None}, response_metadata={'token_usage':
{'completion_tokens': 48, 'prompt_tokens': 228, 'total_tokens': 276,
'completion_tokens_details': None, 'prompt_tokens_details': {'audio_tokens':
None, 'cached_tokens': 192}, 'prompt_cache_hit_tokens': 192,
'prompt_cache_miss_tokens': 36}, 'model_name': 'deepseek-chat',
'system_fingerprint': 'fp_3d5141a69a_prod0225', 'id':
'08ffe30f-b9bd-4d2c-a728-5f7b042faf7e', 'finish_reason': 'tool_calls',
'logprobs': None}, id='run-ab773720-51af-42ec-93eb-1c82ab4ebabb-0',
tool_calls=[{'name': 'multiply', 'args': {'a': 3, 'b': 12}, 'id':
'call_0_3807dd23-8336-4bdd-85e2-cf3bc12d62e5', 'type': 'tool_call'}, {'name':
'add', 'args': {'a': 11, 'b': 49}, 'id':
'call_1_dd3d4e71-6e3f-43dc-841d-3bf8e58dedeb', 'type': 'tool_call'}],
usage_metadata={'input_tokens': 228, 'output_tokens': 48, 'total_tokens': 276,
'input_token_details': {'cache_read': 192}, 'output_token_details': {}})]
##########执行工具调用并获取工具结果
for tool_call in ai_msg.tool_calls:
selected_tool = {"add": add, "multiply": multiply}[tool_call["name"].lower()]
tool_msg = selected_tool.invoke(tool_call)
messages.append(tool_msg)
messages
#
[HumanMessage(content='What is 3 * 12? Also, what is 11 + 49?',
additional_kwargs={}, response_metadata={}),
#
AIMessage(content='', additional_kwargs={'tool_calls': [{'id':
'call_0_3807dd23-8336-4bdd-85e2-cf3bc12d62e5', 'function': {'arguments':
'{"a": 3, "b": 12}', 'name': 'multiply'}, 'type':
'function', 'index': 0}, {'id': 'call_1_dd3d4e71-6e3f-43dc-841d-3bf8e58dedeb',
'function': {'arguments': '{"a": 11, "b": 49}', 'name':
'add'}, 'type': 'function', 'index': 1}], 'refusal': None},
response_metadata={'token_usage': {'completion_tokens': 48, 'prompt_tokens': 228,
'total_tokens': 276, 'completion_tokens_details': None,
'prompt_tokens_details': {'audio_tokens': None, 'cached_tokens': 192},
'prompt_cache_hit_tokens': 192, 'prompt_cache_miss_tokens': 36}, 'model_name':
'deepseek-chat', 'system_fingerprint': 'fp_3d5141a69a_prod0225', 'id':
'08ffe30f-b9bd-4d2c-a728-5f7b042faf7e', 'finish_reason': 'tool_calls',
'logprobs': None}, id='run-ab773720-51af-42ec-93eb-1c82ab4ebabb-0',
tool_calls=[{'name': 'multiply', 'args': {'a': 3, 'b': 12}, 'id':
'call_0_3807dd23-8336-4bdd-85e2-cf3bc12d62e5', 'type': 'tool_call'}, {'name':
'add', 'args': {'a': 11, 'b': 49}, 'id':
'call_1_dd3d4e71-6e3f-43dc-841d-3bf8e58dedeb', 'type': 'tool_call'}],
usage_metadata={'input_tokens': 228, 'output_tokens': 48, 'total_tokens': 276,
'input_token_details': {'cache_read': 192}, 'output_token_details': {}}),
#
ToolMessage(content='36', name='multiply',
tool_call_id='call_0_3807dd23-8336-4bdd-85e2-cf3bc12d62e5'),
#
ToolMessage(content='60', name='add',
tool_call_id='call_1_dd3d4e71-6e3f-43dc-841d-3bf8e58dedeb')]
##########将结果转换为人类语言
llm_with_tools.invoke(messages)
#
AIMessage(content='The result of \\(3 \\times 12\\) is \\(36\\),
and the result of \\(11 + 49\\) is \\(60\\).', additional_kwargs={'refusal': None},
response_metadata={'token_usage': {'completion_tokens': 28, 'prompt_tokens':
286, 'total_tokens': 314, 'completion_tokens_details': None,
'prompt_tokens_details': {'audio_tokens': None, 'cached_tokens': 256}, 'prompt_cache_hit_tokens':
256, 'prompt_cache_miss_tokens': 30}, 'model_name': 'deepseek-chat',
'system_fingerprint': 'fp_3d5141a69a_prod0225', 'id':
'0d010477-6223-412d-aae5-382013024828', 'finish_reason': 'stop', 'logprobs':
None}, id='run-5b8e40ed-2249-4b36-838a-a2c56b0e5cce-0',
usage_metadata={'input_tokens': 286, 'output_tokens': 28, 'total_tokens': 314,
'input_token_details': {'cache_read': 256}, 'output_token_details': {}})

七、后记

感觉一切的变革正在悄然进行,虽然没有创造出可以改变时代的工具的能力,但是跟随大师们的心是要有的。

想入门 AI 大模型却找不到清晰方向?备考大厂 AI 岗还在四处搜集零散资料?别再浪费时间啦!2025 年 AI 大模型全套学习资料已整理完毕,从学习路线到面试真题,从工具教程到行业报告,一站式覆盖你的所有需求,现在全部免费分享

👇👇扫码免费领取全部内容👇👇

一、学习必备:100+本大模型电子书+26 份行业报告 + 600+ 套技术PPT,帮你看透 AI 趋势

想了解大模型的行业动态、商业落地案例?大模型电子书?这份资料帮你站在 “行业高度” 学 AI

1. 100+本大模型方向电子书

在这里插入图片描述

2. 26 份行业研究报告:覆盖多领域实践与趋势

报告包含阿里、DeepSeek 等权威机构发布的核心内容,涵盖:

  • 职业趋势:《AI + 职业趋势报告》《中国 AI 人才粮仓模型解析》;
  • 商业落地:《生成式 AI 商业落地白皮书》《AI Agent 应用落地技术白皮书》;
  • 领域细分:《AGI 在金融领域的应用报告》《AI GC 实践案例集》;
  • 行业监测:《2024 年中国大模型季度监测报告》《2025 年中国技术市场发展趋势》。

3. 600+套技术大会 PPT:听行业大咖讲实战

PPT 整理自 2024-2025 年热门技术大会,包含百度、腾讯、字节等企业的一线实践:

在这里插入图片描述

  • 安全方向:《端侧大模型的安全建设》《大模型驱动安全升级(腾讯代码安全实践)》;
  • 产品与创新:《大模型产品如何创新与创收》《AI 时代的新范式:构建 AI 产品》;
  • 多模态与 Agent:《Step-Video 开源模型(视频生成进展)》《Agentic RAG 的现在与未来》;
  • 工程落地:《从原型到生产:AgentOps 加速字节 AI 应用落地》《智能代码助手 CodeFuse 的架构设计》。

二、求职必看:大厂 AI 岗面试 “弹药库”,300 + 真题 + 107 道面经直接抱走

想冲字节、腾讯、阿里、蔚来等大厂 AI 岗?这份面试资料帮你提前 “押题”,拒绝临场慌!

1. 107 道大厂面经:覆盖 Prompt、RAG、大模型应用工程师等热门岗位

面经整理自 2021-2025 年真实面试场景,包含 TPlink、字节、腾讯、蔚来、虾皮、中兴、科大讯飞、京东等企业的高频考题,每道题都附带思路解析

2. 102 道 AI 大模型真题:直击大模型核心考点

针对大模型专属考题,从概念到实践全面覆盖,帮你理清底层逻辑:

3. 97 道 LLMs 真题:聚焦大型语言模型高频问题

专门拆解 LLMs 的核心痛点与解决方案,比如让很多人头疼的 “复读机问题”:


三、路线必明: AI 大模型学习路线图,1 张图理清核心内容

刚接触 AI 大模型,不知道该从哪学起?这份「AI大模型 学习路线图」直接帮你划重点,不用再盲目摸索!

在这里插入图片描述

路线图涵盖 5 大核心板块,从基础到进阶层层递进:一步步带你从入门到进阶,从理论到实战。

img

L1阶段:启航篇丨极速破界AI新时代

L1阶段:了解大模型的基础知识,以及大模型在各个行业的应用和分析,学习理解大模型的核心原理、关键技术以及大模型应用场景。

img

L2阶段:攻坚篇丨RAG开发实战工坊

L2阶段:AI大模型RAG应用开发工程,主要学习RAG检索增强生成:包括Naive RAG、Advanced-RAG以及RAG性能评估,还有GraphRAG在内的多个RAG热门项目的分析。

img

L3阶段:跃迁篇丨Agent智能体架构设计

L3阶段:大模型Agent应用架构进阶实现,主要学习LangChain、 LIamaIndex框架,也会学习到AutoGPT、 MetaGPT等多Agent系统,打造Agent智能体。

img

L4阶段:精进篇丨模型微调与私有化部署

L4阶段:大模型的微调和私有化部署,更加深入的探讨Transformer架构,学习大模型的微调技术,利用DeepSpeed、Lamam Factory等工具快速进行模型微调,并通过Ollama、vLLM等推理部署框架,实现模型的快速部署。

img

L5阶段:专题集丨特训篇 【录播课】

img
四、资料领取:全套内容免费抱走,学 AI 不用再找第二份

不管你是 0 基础想入门 AI 大模型,还是有基础想冲刺大厂、了解行业趋势,这份资料都能满足你!
现在只需按照提示操作,就能免费领取:

👇👇扫码免费领取全部内容👇👇

2025 年想抓住 AI 大模型的风口?别犹豫,这份免费资料就是你的 “起跑线”!

Logo

更多推荐