2025年是agent爆发之年,集创堂AI实战教练育怡将在近期为大家带来一系列文章,全面呈现agent的工作原理和实用案例。

Agent是什么

简单说,AI Agent 是 “基于大模型(LLM)的智能体” —— 就像一个不用催的 “打工人”,给它一个目标,它能自己想办法完成,不用你步步指挥。

比如你说 “帮我规划周末带爸妈去杭州玩”,普通 AI 只会给景点列表,而 Agent 会:查爸妈喜欢的慢节奏路线、订近景区的酒店、算交通时间,甚至提醒带老人常用药 —— 直接给你一份 “能落地的完整攻略”。

Agent 的 “超能力”:5 个核心本事

Agent 能干活,全靠这 5 个能力撑着,每个都像 “人” 的本事:

  1. **自主性:**不用人盯!比如让它写月度销售报告,它会自己从公司数据库扒数据、整理趋势,不用你逐条给信息;
  2. **交互性:**能 “沟通协作”!游戏里的 AI 队友会跟你配合打怪,客服 Agent 能跟客户一来一回聊需求,不像机器人式回复;
  3. 目的性:“目标感极强”!你说 “搞定孩子生日派对”,它就围绕这个目标,订场地、买蛋糕、邀小朋友,不做无关的事;
  4. **适应性:**会 “灵活变通”!本来订了户外派对,突然下雨,它会立刻改成室内场地,还同步通知嘉宾;
  5. **学习能力:**能 “吃一堑长一智”!第一次写的方案你说 “太官方,要口语化”,下次写活动通知,就会自动调整语气。

Agent 怎么干活?4 步循环搞定任务

Agent 的工作流程像 “人解决问题”,分 4 步循环,拿 “帮你订出差机票” 举例:

  1. 感知环境:它从你聊天记录里看到 “下周三去上海开会”,还知道你怕早班机;
  2. **处理信息:**调取你的出差偏好(靠窗位、选国航)、查周三上海天气(是否有延误风险);
  3. 决策制定:选周三上午 10 点的国航航班,既不早又避开雷雨时段;
  4. **执行行动:**自动下单、给你发确认短信,还同步把航班加进你日历。

核心公式记:AI Agent = 大脑(LLM)+ 做事方法(Planning)+ 工具(Tools)+ 记忆(Memory) —— 缺一个都干不了活。

一个LLM驱动的Agent架构如下图:它需要能够自主计划,使用工具,具有记忆能力,可以自主行动

简单来说:问⼀个问题不止得到答案,而是直接交付成果,可以是报告/网页/营销方案等信息的从准备到审批发布、也可以是实验/策略/旅行等方案的从规划分析到执行

拆解 Agent 的 “身体零件”:4 个关键模块

  • LLM:人的大脑,体现的是基础的智力,反应速度,基础知识,认知。
  • Planning:人的方法论、逻辑思考能力(分析、反思、检查),同样的智力,类似经过训练可以在奥数比赛中得分更高。
  • Memory:人的记忆 + 备忘录。
  • Tool:人的工具(电脑,手机,搜索引擎,计算器)。
  • Perception:人的眼睛,耳朵。(感知,接收信息输入)
1.大脑(LLM):选对 “帮手” 是基础

LLM 是 Agent 的 “脑子”,选不同的大模型,就像找不同特长的帮手:

  • 想写代码:找 DeepSeek R1(擅长代码生成);
  • 日常聊天、查本地信息:找豆包(中文理解超准);
  • 处理复杂多模态任务(比如视频分析):找 ChatGPT 4O。

选对 “脑子”,Agent 才能高效干活。

维度 ChatGPT 5 ChatGPT 4O DeepSeek R1
核心优势 专业领域深度、多模态生成 实时多模态交互、低延迟 数学推理、代码生成
适用场景 医疗 / 金融 / 战略决策 智能硬件 / 实时内容生成 开发工具 / 科学研究
成本 较高 中低
多模态 视频 + 音频 + 文本 音频 + 文本 + 图像 仅文本
回答效果 好(精简+结构化+准确) 好(精简+结构化+准确) 较好(结构化+准确)
维度 DeepSeek V3 豆包 thinking 豆包
核心优势 垂直领域优化、低成本 复杂推理、本土化 中文对话、场景整合
适用场景 企业应用 / 本地化服务 教育 / 供应链优化 客服 / 内容创作 / 政务
成本
多模态 文本 + 图像(代码生成) 仅文本 语音 + 文本 + 图像
回答效果 较好(结构化) 适中(内容长+准确度较差) 适中(内容长+准确度较差)
2.做事方法(Planning):会 “拆解任务 + 反思改进”

定义

Planning 是 Agent 的 “方法论”—— 就像你解数学题要分步骤,Agent 也会拆任务、改错误。

比如算 “外卖员一天赚多少钱”:

它不会直接给答案,而是先拆步骤:算总收入(150 元 / 时 ×10 时 = 1500 元)→算电费(2 度 / 时 ×1 元 / 度 ×10 时 = 20 元)→算净收入(1500-20=1480 元)。

如果第一次算错电费,下次遇到类似问题,它会主动检查 “成本计算步骤”,避免再错 —— 这就是 “反思改进”。

System Prompt:(用户在这里告诉AI需要进行目标分解,并打开AI的“深度思考”模式)

代码块

1.您正在解决数学问题。

2.逐步推理,必要时使用计算器。

3.当您给出最终答案时,请提供解释,说明您是如何得出答案的。

User Prompt:(用户在这里告诉AI应用场景和必要信息)

代码块

1.一名外卖员每小时挣 150 元。如果他每天工作 10 小时,电动车每小时消耗 2 度电,每度电价格为 1 元。请问他一天可以赚多少钱?

LLM Output:(AI输出思考过程和结果)

代码块

1.首先,我们计算了总收入:

总收入 = 150 元/小时 × 10 小时 = 1500 元

2.然后,我们计算了每小时电费支出: 每小时电费支出 = 2 度/小时 × 1 元/度 = 2 元

3.接着,我们计算了每天电费支出: 每天电费支出 = 2 元/小时 × 10 小时 = 20 元

4.最后,我们计算了净收入: 净收入 = 总收入 - 每天电费支出 = 1500 元 - 20 元 = 1480 元

5.因此,外卖员一天可以赚 1480 元。

3.记忆(Memory):不 “健忘” 才靠谱

你有没有过这种体验:跟 AI 聊到一半,它突然忘了前面说的话?想让它帮你查公司旧文档、算复杂账单,它却一脸 “不会”?其实问题出在 AI 的两个关键能力上 ——记忆和工具。今天用大白话拆解,看完你就懂 AI 为啥越来越 “能干” 了。

短期记忆:AI 的 “即时脑容量”,记最近的事儿

短期记忆就像你跟朋友聊天时,脑子里临时记着 “刚说要去吃火锅”“对方不吃辣”——AI 的短期记忆,主要就是你们的对话历史。

比如你跟 AI 聊旅行:先说 “想找带沙滩的酒店”,接着问 “附近有海鲜大排档吗?”AI 能接得上,靠的就是短期记忆。不过它有 “脑容量上限”(叫 “上下文窗口长度”),多数 AI 默认存最近 20 条对话;如果是支持长上下文的模型(比如 GPT-4o),能多存点,就像你集中注意力时能多记几句对话。

但短期记忆有个缺点:“一断电就忘”。比如你关掉聊天窗口再重开,AI 大概率不记得之前聊的内容了 —— 这时候就得靠长期记忆补位。

长期记忆:AI 的 “外部硬盘”,存海量旧信息

长期记忆相当于给 AI 挂了个 “外部硬盘”,平时不用的信息(比如公司文档、你的个人偏好)都存在里面,需要时 AI 会 “主动搜”。

举个例子:你让 AI “整理咱们公司 2024 年新产品的卖点”,这些信息没在对话里提过,AI 就会调用长期记忆 —— 从你提前存好的本地文档库(专业叫 RAG 知识库)里,把文档变成 “数字标签”(叫 embedding 向量化),再快速匹配出 “2024 新产品” 相关的内容。

这就像你记不住某本书的细节时,会去书架上翻对应的书,而不是全靠脑子硬记。

4.AI 的 “工具”:给它装 “手脚”,能落地做事

光有记忆还不够,AI 像个 “光有脑子没手脚” 的人 —— 能想,但没法自己做事。这时候就需要 “工具”(Tool)来帮它落地执行。

简单说:LLM(大模型)是 “大脑”,负责想 “要做什么”;工具是 “手脚”,负责干 “具体怎么做”。

比如:

  • 你让 AI “查北京明天的天气”:AI 大脑会发指令 “需要搜天气”,但它自己没法联网,这时候 “搜索引擎工具” 就会接手,执行 “搜索‘北京明天天气’” 的操作,再把结果反馈给 AI;
  • 你让 AI“算这个月房租(4500)+ 水电费(380)+ 物业费(200)的总开销”:AI 大脑知道 “要算加法”,但它没法直接算精准数字,会调用 “计算器工具”,算出结果后再告诉你。

没有工具的 AI,只能跟你 “嘴炮聊天”;有了工具,它能联网查信息、算数据、甚至生成表格 —— 相当于从 “只会说” 变成 “能干活”。

Agent的自建工具和实践案例

多维表格和coze都可以实现快速搭建agent,支持低代码 / 无代码操作,仅需提示词或可视化配置;

多维表格搭建 Agent,支持批量处理任务,且搭建门槛低,借助思维链,用提示词直述需求就能完成;

Coze 搭建 Agent 更擅长单次复杂任务,不过门槛较高,需要通过提示词或工作流来约束过程。

多维表格工具-文章创作agent

该 Agent 通过模块化设计,将自然语言改写(适配小红书风格)、多模态生成(图片)、跨语言转换(英文翻译)三大能力封装

用户输入一段文案内容,文章创作agent就可以基于小红书博主风格进行文章改写、图片生成、甚至能翻译为英文语言。

Step 1 :用户输入文案

Step 2: 文章创作Agent处理文案

Step 3: 文章创作Agent输出改写内容和图片

Coze工具-产品分析报告agent

用户输入一个产品名称,产品分析agent会基于预置的工作流程、分析思路和工具 来进行全网检索和产品分析,最终输出一份产品分析报告

产品分析Agent输出的报告:

产品分析Agent输出的文本内容:

产品分析Agent背后的工作原理:

如何学习大模型 AI ?

我国在AI大模型领域面临人才短缺,数量与质量均落后于发达国家。2023年,人才缺口已超百万,凸显培养不足。随着Al技术飞速发展,预计到2025年,这一缺口将急剧扩大至400万,严重制约我国Al产业的创新步伐。加强人才培养,优化教育体系,国际合作并进,是破解困局、推动AI发展的关键。

但是具体到个人,只能说是:

“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。

这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

在这里插入图片描述

2025最新大模型学习路线

明确的学习路线至关重要。它能指引新人起点、规划学习顺序、明确核心知识点。大模型领域涉及的知识点非常广泛,没有明确的学习路线可能会导致新人感到迷茫,不知道应该专注于哪些内容。

对于从来没有接触过AI大模型的同学,我帮大家准备了从零基础到精通学习成长路线图以及学习规划。可以说是最科学最系统的学习路线。

在这里插入图片描述

针对以上大模型的学习路线我们也整理了对应的学习视频教程,和配套的学习资料。

大模型经典PDF书籍

新手必备的大模型学习PDF书单来了!全是硬核知识,帮你少走弯路!

在这里插入图片描述

配套大模型项目实战

所有视频教程所涉及的实战项目和项目源码等
在这里插入图片描述

博主介绍+AI项目案例集锦

MoPaaS专注于Al技术能力建设与应用场景开发,与智学优课联合孵化,培养适合未来发展需求的技术性人才和应用型领袖。

在这里插入图片描述

在这里插入图片描述

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

在这里插入图片描述

为什么要学习大模型?

2025人工智能大模型的技术岗位与能力培养随着人工智能技术的迅速发展和应用 , 大模型作为其中的重要组成部分 , 正逐渐成为推动人工智能发展的重要引擎 。大模型以其强大的数据处理和模式识别能力, 广泛应用于自然语言处理 、计算机视觉 、 智能推荐等领域 ,为各行各业带来了革命性的改变和机遇 。

在这里插入图片描述

适合人群

  • 在校学生:包括专科、本科、硕士和博士研究生。学生应具备扎实的编程基础和一定的数学基础,有志于深入AGI大模型行业,希望开展相关的研究和开发工作。
  • IT行业从业人员:包括在职或失业者,涵盖开发、测试、运维、产品经理等职务。拥有一定的IT从业经验,至少1年以上的编程工作经验,对大模型技术感兴趣或有业务需求,希望通过课程提升自身在IT领域的竞争力。
  • IT管理及技术研究领域人员:包括技术经理、技术负责人、CTO、架构师、研究员等角色。这些人员需要跟随技术发展趋势,主导技术创新,推动大模型技术在企业业务中的应用与改造。
  • 传统AI从业人员:包括算法工程师、机器视觉工程师、深度学习工程师等。这些AI技术人才原先从事机器视觉、自然语言处理、推荐系统等领域工作,现需要快速补充大模型技术能力,获得大模型训练微调的实操技能,以适应新的技术发展趋势。
    在这里插入图片描述

课程精彩瞬间

大模型核心原理与Prompt:掌握大语言模型的核心知识,了解行业应用与趋势;熟练Python编程,提升提示工程技能,为Al应用开发打下坚实基础。

在这里插入图片描述

RAG应用开发工程:掌握RAG应用开发全流程,理解前沿技术,提升商业化分析与优化能力,通过实战项目加深理解与应用。 在这里插入图片描述

Agent应用架构进阶实践:掌握大模型Agent技术的核心原理与实践应用,能够独立完成Agent系统的设计与开发,提升多智能体协同与复杂任务处理的能力,为AI产品的创新与优化提供有力支持。
在这里插入图片描述

模型微调与私有化大模型:掌握大模型微调与私有化部署技能,提升模型优化与部署能力,为大模型项目落地打下坚实基础。 在这里插入图片描述

顶尖师资,深耕AI大模型前沿技术

实战专家亲授,让你少走弯路
在这里插入图片描述

一对一学习规划,职业生涯指导

  • 真实商业项目实训
  • 大厂绿色直通车

人才库优秀学员参与真实商业项目实训

以商业交付标准作为学习标准,具备真实大模型项目实践操作经验可写入简历,支持项目背调

在这里插入图片描述
大厂绿色直通车,冲击行业高薪岗位
在这里插入图片描述

文中涉及到的完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

在这里插入图片描述

Logo

更多推荐