在这里插入图片描述

大家在接触大模型应用开发时,经常会被 Memory、RAG、MCP、Agent 这些专业名词绕晕。其实它们并非孤立的技术,而是一层层叠加,为了让大模型从一个“只会背书的复读机”进化成“懂历史、有知识、会动手的智能体”。

下面我们用最通俗易懂的逻辑,把这些核心概念串讲一遍。


1. 底座基石:LLM(大语言模型)

定义:
大模型本质上就是用来提供推理服务的。你可以把它想象成一个巨大的、装满了参数的大脑。

技术本质:
剥开复杂的外壳,调用大模型其实就是一次 HTTP 网络请求。你发文字过去,它计算后把文字返回给你。


2. 第一层进化:Memory(记忆)

痛点:
大模型天生是“金鱼脑”,它不记得上一句话你说了什么。

解决方案:
每次发起新请求时,系统会把之前全部的聊天记录重新拼接在一起,作为 Prompt 的一部分发给大模型。这份拼接起来的内容就叫上下文

Memory 机制的分类:

  • 短期记忆: 当前会话窗口里最近的几轮对话。
  • 长期记忆: 将很久之前的对话压缩成摘要或向量存入数据库。

工作机制:
每次请求时,系统把 长期记忆摘要 + 短期对话记录 拼在一起喂给模型。这套管理上下文存取、拼接、裁剪的机制,就是 Memory


3. 第二层进化:RAG(检索增强生成)

痛点:
大模型的训练数据是存量且滞后的。如果你问它“今天发生了什么新闻”或者“公司内部最新的报销政策是什么”,它要么胡说八道,要么直接说不知道。

解决方案:
给大模型配一个外部知识库

核心流程:

  1. 存: 把外部知识(文档、PDF、网页)切块,转化成向量(一串代表语义的数字),存入向量数据库
  2. 检: 用户提问时,先去向量数据库里检索语义最相似的内容片段。
  3. 答: 把检索到的内容片段连同用户问题一起发给大模型,让它基于资料作答。

关键点:

  • 之所以用向量数据库,是因为它不搞死板的字面匹配,而是计算语义距离,能听懂“感冒了”和“着凉了”是一回事。
  • RAG = 检索 + 生成

4. 第三层进化:MCP(模型上下文协议)

痛点:
有了 Memory 和 RAG,大模型变成了“满腹经纶的活字典”,但它依然没有手和脚。它无法帮你发邮件、订机票、操作 Excel。

解决方案:
在对话中约定一种 JSON 格式的暗号

运作机制:

  1. 告知工具: 外部服务先告诉大模型:“我现在有 搜索网页发送邮件 这两个工具,参数格式要求是这样…”
  2. 模型决策: 大模型思考后,觉得需要搜索,它不输出最终答案,而是输出一段 特定格式的 JSON 指令{"tool": "search_web", "query": "今日天气"}
  3. 执行反馈: 外部程序截获这段 JSON,去执行真正的搜索操作,拿到结果后,再把结果塞回对话记录里发给大模型。
  4. 最终生成: 大模型看着搜索结果,生成自然语言回复:“今天天气晴,适合出门。”

工程化抽象 —— MCP:
这套“通过结构化消息调用外部工具”的规范,被抽象成了 MCP 协议

  • MCP Host: 负责解析 JSON 和调度工具的中间程序。
  • MCP 插件: 具体干活的工具(可以拆分为本地的 Client 和远端的 Server)。

5. 第四层进化:Skills(技能/指南)

痛点:
工具多了,大模型就懵了。它不知道怎么组合工具——是先查天气再订票,还是先订票再查路线?

解决方案:
给大模型一份 操作手册(SOP)

定义:
Skills 就是一份结构化的场景指南。它明确告诉大模型:

“当你需要做旅行规划时,请务必先用 地图工具 查路线,再用 天气工具 查目的地天气,最后生成表格。注意:时间一定要换算成当地时间。”

Skills vs. Workflow 的核心区别:

  • Workflow(工作流): 死板的流程图。A 节点到 B 节点,在设计时就画死了,一旦执行,必须按既定路线走。
  • Skills: 由大模型驱动的 Workflow。它只给了指导方针和最佳实践,具体先走哪步、遇到意外怎么绕路,全由大模型根据实时情况灵活决策Skills 的执行路径不是预设的,而是模型推理出来的。

6. 终极形态:AI Agent(智能体)

把上面所有的零件组装起来:

组件 赋予的能力
LLM 大脑,思考与规划
Memory 记忆力,记住历史
RAG 知识库,获取新知
MCP 手和脚,操作工具
Skills 经验手册,指导做事流程

结论:
AI Agent = LLM + Memory + RAG + MCP + Skills

它不再是只会聊天的 Bot,而是一个能自主感知、规划、行动、达成目标的智能工具人

举例说明:

  • 最近很火的 OpenClaw 本质上就是典型的 AI Agent 产品,它的目标是帮你操作电脑完成各种任务。

(ps:尽管AI冲击依旧持续,年初的那篇“如何在人工智能时代找到自己的价值”依然无从解答,但生活推着你走的时候,你也不得不走。整理一些东西出来可以安慰自己也在努力融入了😊)

Logo

小龙虾开发者社区是 CSDN 旗下专注 OpenClaw 生态的官方阵地,聚焦技能开发、插件实践与部署教程,为开发者提供可直接落地的方案、工具与交流平台,助力高效构建与落地 AI 应用

更多推荐