AI Agent是基于大模型的智能体,能自主完成目标任务。它具备自主性、交互性、目的性、适应性和学习能力五大核心能力,通过感知环境、处理信息、决策制定和执行行动的循环流程工作。Agent的架构由大脑(LLM)、做事方法(Planning)、工具(Tools)和记忆(Memory)四部分组成。通过多维表格和Coze等工具,小白也能快速搭建自己的Agent,实现从查询信息到完成复杂任务的转变。


2025年是agent爆发之年,集创堂AI实战教练育怡将在近期为大家带来一系列文章,全面呈现agent的工作原理和实用案例。

Agent是什么

简单说,AI Agent 是 “基于大模型(LLM)的智能体” —— 就像一个不用催的 “打工人”,给它一个目标,它能自己想办法完成,不用你步步指挥。

比如你说 “帮我规划周末带爸妈去杭州玩”,普通 AI 只会给景点列表,而 Agent 会:查爸妈喜欢的慢节奏路线、订近景区的酒店、算交通时间,甚至提醒带老人常用药 —— 直接给你一份 “能落地的完整攻略”。

Agent 的 “超能力”:5 个核心本事

Agent 能干活,全靠这 5 个能力撑着,每个都像 “人” 的本事:

  1. **自主性:**不用人盯!比如让它写月度销售报告,它会自己从公司数据库扒数据、整理趋势,不用你逐条给信息;
  2. **交互性:**能 “沟通协作”!游戏里的 AI 队友会跟你配合打怪,客服 Agent 能跟客户一来一回聊需求,不像机器人式回复;
  3. 目的性:“目标感极强”!你说 “搞定孩子生日派对”,它就围绕这个目标,订场地、买蛋糕、邀小朋友,不做无关的事;
  4. **适应性:**会 “灵活变通”!本来订了户外派对,突然下雨,它会立刻改成室内场地,还同步通知嘉宾;
  5. **学习能力:**能 “吃一堑长一智”!第一次写的方案你说 “太官方,要口语化”,下次写活动通知,就会自动调整语气。

Agent 怎么干活?4 步循环搞定任务

Agent 的工作流程像 “人解决问题”,分 4 步循环,拿 “帮你订出差机票” 举例:

  1. 感知环境:它从你聊天记录里看到 “下周三去上海开会”,还知道你怕早班机;
  2. **处理信息:**调取你的出差偏好(靠窗位、选国航)、查周三上海天气(是否有延误风险);
  3. 决策制定:选周三上午 10 点的国航航班,既不早又避开雷雨时段;
  4. **执行行动:**自动下单、给你发确认短信,还同步把航班加进你日历。

核心公式记:AI Agent = 大脑(LLM)+ 做事方法(Planning)+ 工具(Tools)+ 记忆(Memory) —— 缺一个都干不了活。

一个LLM驱动的Agent架构如下图:它需要能够自主计划,使用工具,具有记忆能力,可以自主行动

简单来说:问⼀个问题不止得到答案,而是直接交付成果,可以是报告/网页/营销方案等信息的从准备到审批发布、也可以是实验/策略/旅行等方案的从规划分析到执行

拆解 Agent 的 “身体零件”:4 个关键模块

  • LLM:人的大脑,体现的是基础的智力,反应速度,基础知识,认知。
  • Planning:人的方法论、逻辑思考能力(分析、反思、检查),同样的智力,类似经过训练可以在奥数比赛中得分更高。
  • Memory:人的记忆 + 备忘录。
  • Tool:人的工具(电脑,手机,搜索引擎,计算器)。
  • Perception:人的眼睛,耳朵。(感知,接收信息输入)
1.大脑(LLM):选对 “帮手” 是基础

LLM 是 Agent 的 “脑子”,选不同的大模型,就像找不同特长的帮手:

  • 想写代码:找 DeepSeek R1(擅长代码生成);
  • 日常聊天、查本地信息:找豆包(中文理解超准);
  • 处理复杂多模态任务(比如视频分析):找 ChatGPT 4O。

选对 “脑子”,Agent 才能高效干活。

维度 ChatGPT 5 ChatGPT 4O DeepSeek R1
核心优势 专业领域深度、多模态生成 实时多模态交互、低延迟 数学推理、代码生成
适用场景 医疗 / 金融 / 战略决策 智能硬件 / 实时内容生成 开发工具 / 科学研究
成本 较高 中低
多模态 视频 + 音频 + 文本 音频 + 文本 + 图像 仅文本
回答效果 好(精简+结构化+准确) 好(精简+结构化+准确) 较好(结构化+准确)
维度 DeepSeek V3 豆包 thinking 豆包
核心优势 垂直领域优化、低成本 复杂推理、本土化 中文对话、场景整合
适用场景 企业应用 / 本地化服务 教育 / 供应链优化 客服 / 内容创作 / 政务
成本
多模态 文本 + 图像(代码生成) 仅文本 语音 + 文本 + 图像
回答效果 较好(结构化) 适中(内容长+准确度较差) 适中(内容长+准确度较差)
2.做事方法(Planning):会 “拆解任务 + 反思改进”

定义

Planning 是 Agent 的 “方法论”—— 就像你解数学题要分步骤,Agent 也会拆任务、改错误。

比如算 “外卖员一天赚多少钱”:

它不会直接给答案,而是先拆步骤:算总收入(150 元 / 时 ×10 时 = 1500 元)→算电费(2 度 / 时 ×1 元 / 度 ×10 时 = 20 元)→算净收入(1500-20=1480 元)。

如果第一次算错电费,下次遇到类似问题,它会主动检查 “成本计算步骤”,避免再错 —— 这就是 “反思改进”。

System Prompt:(用户在这里告诉AI需要进行目标分解,并打开AI的“深度思考”模式)

代码块

1.您正在解决数学问题。

2.逐步推理,必要时使用计算器。

3.当您给出最终答案时,请提供解释,说明您是如何得出答案的。

User Prompt:(用户在这里告诉AI应用场景和必要信息)

代码块

1.一名外卖员每小时挣 150 元。如果他每天工作 10 小时,电动车每小时消耗 2 度电,每度电价格为 1 元。请问他一天可以赚多少钱?

LLM Output:(AI输出思考过程和结果)

代码块

1.首先,我们计算了总收入:

总收入 = 150 元/小时 × 10 小时 = 1500 元

2.然后,我们计算了每小时电费支出: 每小时电费支出 = 2 度/小时 × 1 元/度 = 2 元

3.接着,我们计算了每天电费支出: 每天电费支出 = 2 元/小时 × 10 小时 = 20 元

4.最后,我们计算了净收入: 净收入 = 总收入 - 每天电费支出 = 1500 元 - 20 元 = 1480 元

5.因此,外卖员一天可以赚 1480 元。

3.记忆(Memory):不 “健忘” 才靠谱

你有没有过这种体验:跟 AI 聊到一半,它突然忘了前面说的话?想让它帮你查公司旧文档、算复杂账单,它却一脸 “不会”?其实问题出在 AI 的两个关键能力上 ——记忆和工具。今天用大白话拆解,看完你就懂 AI 为啥越来越 “能干” 了。

短期记忆:AI 的 “即时脑容量”,记最近的事儿

短期记忆就像你跟朋友聊天时,脑子里临时记着 “刚说要去吃火锅”“对方不吃辣”——AI 的短期记忆,主要就是你们的对话历史。

比如你跟 AI 聊旅行:先说 “想找带沙滩的酒店”,接着问 “附近有海鲜大排档吗?”AI 能接得上,靠的就是短期记忆。不过它有 “脑容量上限”(叫 “上下文窗口长度”),多数 AI 默认存最近 20 条对话;如果是支持长上下文的模型(比如 GPT-4o),能多存点,就像你集中注意力时能多记几句对话。

但短期记忆有个缺点:“一断电就忘”。比如你关掉聊天窗口再重开,AI 大概率不记得之前聊的内容了 —— 这时候就得靠长期记忆补位。

长期记忆:AI 的 “外部硬盘”,存海量旧信息

长期记忆相当于给 AI 挂了个 “外部硬盘”,平时不用的信息(比如公司文档、你的个人偏好)都存在里面,需要时 AI 会 “主动搜”。

举个例子:你让 AI “整理咱们公司 2024 年新产品的卖点”,这些信息没在对话里提过,AI 就会调用长期记忆 —— 从你提前存好的本地文档库(专业叫 RAG 知识库)里,把文档变成 “数字标签”(叫 embedding 向量化),再快速匹配出 “2024 新产品” 相关的内容。

这就像你记不住某本书的细节时,会去书架上翻对应的书,而不是全靠脑子硬记。

4.AI 的 “工具”:给它装 “手脚”,能落地做事

光有记忆还不够,AI 像个 “光有脑子没手脚” 的人 —— 能想,但没法自己做事。这时候就需要 “工具”(Tool)来帮它落地执行。

简单说:LLM(大模型)是 “大脑”,负责想 “要做什么”;工具是 “手脚”,负责干 “具体怎么做”。

比如:

  • 你让 AI “查北京明天的天气”:AI 大脑会发指令 “需要搜天气”,但它自己没法联网,这时候 “搜索引擎工具” 就会接手,执行 “搜索‘北京明天天气’” 的操作,再把结果反馈给 AI;
  • 你让 AI“算这个月房租(4500)+ 水电费(380)+ 物业费(200)的总开销”:AI 大脑知道 “要算加法”,但它没法直接算精准数字,会调用 “计算器工具”,算出结果后再告诉你。

没有工具的 AI,只能跟你 “嘴炮聊天”;有了工具,它能联网查信息、算数据、甚至生成表格 —— 相当于从 “只会说” 变成 “能干活”。

Agent的自建工具和实践案例

多维表格和coze都可以实现快速搭建agent,支持低代码 / 无代码操作,仅需提示词或可视化配置;

多维表格搭建 Agent,支持批量处理任务,且搭建门槛低,借助思维链,用提示词直述需求就能完成;

Coze 搭建 Agent 更擅长单次复杂任务,不过门槛较高,需要通过提示词或工作流来约束过程。

多维表格工具-文章创作agent

该 Agent 通过模块化设计,将自然语言改写(适配小红书风格)、多模态生成(图片)、跨语言转换(英文翻译)三大能力封装

用户输入一段文案内容,文章创作agent就可以基于小红书博主风格进行文章改写、图片生成、甚至能翻译为英文语言。

Step 1 :用户输入文案

Step 2: 文章创作Agent处理文案

Step 3: 文章创作Agent输出改写内容和图片

Coze工具-产品分析报告agent

用户输入一个产品名称,产品分析agent会基于预置的工作流程、分析思路和工具 来进行全网检索和产品分析,最终输出一份产品分析报告

产品分析Agent输出的报告:

产品分析Agent输出的文本内容:

产品分析Agent背后的工作原理:


零基础如何高效学习大模型?

为了帮助大家打破壁垒,快速了解大模型核心技术原理,学习相关大模型技术。从原理出发真正入局大模型。在这里我和MoPaaS魔泊云联合梳理打造了系统大模型学习脉络,这份 LLM大模型资料 分享出来:包括LLM大模型书籍、640套大模型行业报告、LLM大模型学习视频、LLM大模型学习路线、开源大模型学习教程等, 😝有需要的小伙伴,可以 扫描下方二维码免费领取🆓**⬇️⬇️⬇️

在这里插入图片描述

【大模型全套视频教程】

教程从当下的市场现状和趋势出发,分析各个岗位人才需求,带你充分了解自身情况,get 到适合自己的 AI 大模型入门学习路线。

从基础的 prompt 工程入手,逐步深入到 Agents,其中更是详细介绍了 LLM 最重要的编程框架 LangChain。最后把微调与预训练进行了对比介绍与分析。

同时课程详细介绍了AI大模型技能图谱知识树,规划属于你自己的大模型学习路线,并且专门提前收集了大家对大模型常见的疑问,集中解答所有疑惑!

在这里插入图片描述

深耕 AI 领域技术专家带你快速入门大模型

跟着行业技术专家免费学习的机会非常难得,相信跟着学习下来能够对大模型有更加深刻的认知和理解,也能真正利用起大模型,从而“弯道超车”,实现职业跃迁!

在这里插入图片描述

【精选AI大模型权威PDF书籍/教程】

精心筛选的经典与前沿并重的电子书和教程合集,包含《深度学习》等一百多本书籍和讲义精要等材料。绝对是深入理解理论、夯实基础的不二之选。

在这里插入图片描述

【AI 大模型面试题 】

除了 AI 入门课程,我还给大家准备了非常全面的**「AI 大模型面试题」,**包括字节、腾讯等一线大厂的 AI 岗面经分享、LLMs、Transformer、RAG 面试真题等,帮你在面试大模型工作中更快一步。

【大厂 AI 岗位面经分享(92份)】

图片

【AI 大模型面试真题(102 道)】

图片

【LLMs 面试真题(97 道)】

图片

【640套 AI 大模型行业研究报告】

在这里插入图片描述

【AI大模型完整版学习路线图(2025版)】

明确学习方向,2025年 AI 要学什么,这一张图就够了!

img

👇👇点击下方卡片链接免费领取全部内容👇👇

在这里插入图片描述

抓住AI浪潮,重塑职业未来!

科技行业正处于深刻变革之中。英特尔等巨头近期进行结构性调整,缩减部分传统岗位,同时AI相关技术岗位(尤其是大模型方向)需求激增,已成为不争的事实。具备相关技能的人才在就业市场上正变得炙手可热。

行业趋势洞察:

  • 转型加速: 传统IT岗位面临转型压力,拥抱AI技术成为关键。
  • 人才争夺战: 拥有3-5年经验、扎实AI技术功底真实项目经验的工程师,在头部大厂及明星AI企业中的薪资竞争力显著提升(部分核心岗位可达较高水平)。
  • 门槛提高: “具备AI项目实操经验”正迅速成为简历筛选的重要标准,预计未来1-2年将成为普遍门槛。

与其观望,不如行动!

面对变革,主动学习、提升技能才是应对之道。掌握AI大模型核心原理、主流应用技术与项目实战经验,是抓住时代机遇、实现职业跃迁的关键一步。

在这里插入图片描述

01 为什么分享这份学习资料?

当前,我国在AI大模型领域的高质量人才供给仍显不足,行业亟需更多有志于此的专业力量加入。

因此,我们决定将这份精心整理的AI大模型学习资料,无偿分享给每一位真心渴望进入这个领域、愿意投入学习的伙伴!

我们希望能为你的学习之路提供一份助力。如果在学习过程中遇到技术问题,也欢迎交流探讨,我们乐于分享所知。

*02 这份资料的价值在哪里?*

专业背书,系统构建:

  • 本资料由我与MoPaaS魔泊云的鲁为民博士共同整理。鲁博士拥有清华大学学士美国加州理工学院博士学位,在人工智能领域造诣深厚:

    • 在IEEE Transactions等顶级学术期刊及国际会议发表论文超过50篇
    • 拥有多项中美发明专利。
    • 荣获吴文俊人工智能科学技术奖(中国人工智能领域重要奖项)。
  • 目前,我有幸与鲁博士共同进行人工智能相关研究。

在这里插入图片描述

内容实用,循序渐进:

  • 资料体系化覆盖了从基础概念入门核心技术进阶的知识点。

  • 包含丰富的视频教程实战项目案例,强调动手实践能力。

  • 无论你是初探AI领域的新手,还是已有一定技术基础希望深入大模型的学习者,这份资料都能为你提供系统性的学习路径和宝贵的实践参考助力你提升技术能力,向大模型相关岗位转型发展

    在这里插入图片描述在这里插入图片描述在这里插入图片描述

抓住机遇,开启你的AI学习之旅!

在这里插入图片描述

Logo

更多推荐