随着人工智能从生成式AI(Generative AI)向智能体AI(Agentic AI)演进,2025年被广泛视为Agent市场的元年。智能体架构的技术讨论日益活跃,其核心组件的标准化与抽象化也日趋成熟——例如像MCP(Model Context Protocol)和A2A(Agent-to-Agent)这类协议逐渐定义了Agent如何调用工具以及多Agent之间如何交互。在智能体的基本架构中,记忆(Memory) 作为其核心能力之一,正受到越来越多的关注。

图片

一般认为,智能体应包括以下几部分能力:

  1. 感知能力(Perception):接收多模态信息输入。
  2. 决策能力(Brain-Decision Making):实现任务规划与复杂决策。
  3. 记忆能力(Brain-Memory & Knowledge):存储与管理智能体的知识、经验与技能。
  4. 行动能力(Action):与外部环境进行交互。

本期分享,我将重点剖析记忆能力,探讨其定义、分类、关键操作,以及当前主流技术实现方案。

一、为什么智能体需要记忆?

记忆不仅是信息的存储,更是智能体实现持续学习、保持一致行为与提供个性化服务的基础。其核心价值体现在:

  1. 持续学习与优化
    大语言模型(LLM)的参数本质是静态的,而记忆系统使得智能体能够积累历史经验、从错误中学习,并不断优化其行为表现。

  2. 对话连贯与行为一致
    记忆帮助智能体维护长上下文,在多轮交互中保持一致逻辑,避免出现前后矛盾。

  3. 个性化服务
    通过历史交互推断用户偏好,构建用户心理模型,从而提供更符合用户习惯的回复或服务。

二、记忆的分类与结构

从人脑记忆到AI记忆的类比

记忆在人脑中被广泛研究,经典的Atkinson-Shiffrin记忆模型将其分为:

  • 感知记忆(Sensory Memory):暂存原始感知信息。
  • 短期记忆(Short-term Memory):处理当前任务所需信息。
  • 长期记忆(Long-term Memory):存储知识、经验与技能。

此外,按内容形式也可分为:

  • 显式记忆(Explicit Memory):可用语言描述,需有意识调取,如事实与事件。
  • 隐式记忆(Implicit Memory):难以用语言描述,如技能(骑自行车)。

在AI智能体中,记忆系统也具备类似的层次与类型划分:

图片

智能体中的记忆存储区主要包括:

  1. 上下文(Context):相当于短期记忆,容量有限且易遗忘。
  2. LLM参数内知识:属于长期记忆,但不可更新。
  3. 外挂存储(如向量数据库、知识图谱):扩展的长期记忆,支持动态写入与读取。

记忆按存储形式可分为:

  • 参数记忆(Parametric):如模型微调(Fine-Tuning),融入模型参数。
  • 非参数记忆(Non-parametric):如RAG检索、知识库,外挂存储且可动态更新。

三、记忆的核心操作

无论是人类还是AI,记忆都包括三个基本操作:

  1. 编码(Encode):处理信息并转换为可存储格式。
  2. 存储(Storage):将信息存入短期或长期记忆区。
  3. 提取(Retrieval):在需要时访问并使用已存信息。

此外还包括巩固(Consolidation)、再巩固(Reconsolidation)、反思(Reflection)和遗忘(Forgetting)等高级操作。

在智能体系统中,这些操作对应如Embedding生成、向量存储与检索、摘要生成和记忆更新等具体技术手段。

四、主流记忆实现方案分析

1. MemoryBank

MemoryBank较早提出基于心理学理论的记忆机制,其特点包括:

  • 对对话内容进行摘要与定期回顾;

  • 引入遗忘曲线动态管理记忆生命周期;

  • 通过用户画像提供个性化交互。

图片

2. LETTA(原MemGPT)

借鉴操作系统虚拟内存分页机制,将上下文分为:

  • Main Context:存放系统指令、关键事实和近期对话;
  • External Context:存储历史摘要与较早记录。

通过函数调用实现记忆的自我管理与调度。

图片

3. ZEP

面向企业场景,提出时间感知的知识图谱,包括三层结构:

  • 情境子图:存储原始交互数据;
  • 语义子图:提取实体与关系;
  • 社区子图:对语义进行高层次聚类。

支持混合检索(向量、全文、图遍历),在复杂推理任务中表现优异。

图片

4. Mem0 & Mem0-G

Mem0 是当前最受欢迎的开源记忆框架之一,提供两种实现:

  • Mem0:基于语义检索与摘要生成;
  • Mem0-G:引入知识图谱,支持冲突检测与动态更新。

在LOCOMO测试中综合表现突出。

图片

5. MemOS

由国内初创公司“记忆张量”开发,近期获亿元天使轮融资。其特点包括:

  • 将记忆划分为纯文本记忆激活记忆参数记忆,支持动态转换;

  • 提出记忆立方体(MemCube) 作为统一抽象;

  • 构建多视角记忆结构(标签、图谱、分层)。

在多项基准测试中达到SOTA水平。

图片

6. MIRIX

采用多Agent架构管理记忆,将记忆分为6类组件,分别处理不同内容与检索逻辑。提出“精细路由+提取”为记忆检索的关键。

图片

五、总结与技术趋势

从各类实现方案中可总结出如下趋势:

  1. 精细化管理:不同类型的记忆需区别处理,类似Multi-Agent中的分治策略;
  2. 混合存储结构:结合标签、文本、图谱等多种结构,提升检索准确性;
  3. 检索优化:混合检索(向量+全文+图检索)成为主流;
  4. 动态调度与路由:根据访问模式实现记忆的冷热转换与自我更新。

记忆系统是智能体实现长期交互、持续学习和个性化服务的核心。早期 Memory 主要聚焦在对话记忆,现在已扩展到任务执行、决策支持、个性化服务等多个场景,覆盖的记忆类型也更加全面。好了,本期分享就到这里,点个小红心,我们下期见。

五、AI大模型从0到精通全套学习大礼包

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

只要你是真心想学AI大模型,我这份资料就可以无偿共享给你学习。大模型行业确实也需要更多的有志之士加入进来,我也真心希望帮助大家学好这门技术,如果日后有什么学习上的问题,欢迎找我交流,有技术上面的问题,我是很愿意去帮助大家的!

如果你也想通过学大模型技术去帮助就业和转行,可以扫描下方链接👇👇
大模型重磅福利:入门进阶全套104G学习资源包免费分享!
在这里插入图片描述

01.从入门到精通的全套视频教程

包含提示词工程、RAG、Agent等技术点
在这里插入图片描述

02.AI大模型学习路线图(还有视频解说)

全过程AI大模型学习路线

在这里插入图片描述
在这里插入图片描述

03.学习电子书籍和技术文档

市面上的大模型书籍确实太多了,这些是我精选出来的

在这里插入图片描述
在这里插入图片描述

04.大模型面试题目详解

在这里插入图片描述

在这里插入图片描述

05.这些资料真的有用吗?

这份资料由我和鲁为民博士共同整理,鲁为民博士先后获得了北京清华大学学士和美国加州理工学院博士学位,在包括IEEE Transactions等学术期刊和诸多国际会议上发表了超过50篇学术论文、取得了多项美国和中国发明专利,同时还斩获了吴文俊人工智能科学技术奖。目前我正在和鲁博士共同进行人工智能的研究。

所有的视频由智泊AI老师录制,且资料与智泊AI共享,相互补充。这份学习大礼包应该算是现在最全面的大模型学习资料了。

资料内容涵盖了从入门到进阶的各类视频教程和实战项目,无论你是小白还是有些技术基础的,这份资料都绝对能帮助你提升薪资待遇,转行大模型岗位。

在这里插入图片描述
在这里插入图片描述

智泊AI始终秉持着“让每个人平等享受到优质教育资源”的育人理念‌,通过动态追踪大模型开发、数据标注伦理等前沿技术趋势‌,构建起"前沿课程+智能实训+精准就业"的高效培养体系。

课堂上不光教理论,还带着学员做了十多个真实项目。学员要亲自上手搞数据清洗、模型调优这些硬核操作,把课本知识变成真本事‌!

在这里插入图片描述
如果说你是以下人群中的其中一类,都可以来智泊AI学习人工智能,找到高薪工作,一次小小的“投资”换来的是终身受益!

应届毕业生‌:无工作经验但想要系统学习AI大模型技术,期待通过实战项目掌握核心技术。

零基础转型‌:非技术背景但关注AI应用场景,计划通过低代码工具实现“AI+行业”跨界‌。

业务赋能 ‌突破瓶颈:传统开发者(Java/前端等)学习Transformer架构与LangChain框架,向AI全栈工程师转型‌。

👉获取方式:
😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

在这里插入图片描述

Logo

更多推荐