随着人工智能领域从生成式AI(Generative AI)向智能体AI(Agentic AI)加速演进,2025年被行业普遍视作Agent市场的爆发元年。当前,智能体架构的技术研讨热度持续攀升,核心组件的标准化与抽象化进程不断推进——诸如MCP(Model Context Protocol,模型上下文协议)与A2A(Agent-to-Agent,智能体间交互协议)等关键协议,正逐步明确智能体调用外部工具的流程规范,以及多智能体协同工作的交互逻辑。而在智能体的基础架构体系中,记忆(Memory)作为支撑其“类人智能”的核心能力模块,正吸引着全球技术研究者与企业的高度关注

图片

从技术架构视角来看,一个功能完备的智能体通常需具备四大核心能力,具体如下:

  1. 感知能力(Perception):能够接收文本、图像、音频、视频等多模态信息输入,并完成初步的信息解析与预处理。
  2. 决策能力(Brain-Decision Making):依托算法模型实现任务拆解、路径规划与复杂场景下的决策判断,例如自动生成会议纪要的步骤规划。
  3. 记忆能力(Brain-Memory & Knowledge):负责存储与管理智能体在交互过程中积累的知识、历史经验与技能,是实现“持续学习”的关键。
  4. 行动能力(Action):能够与外部系统或环境进行交互,如调用API接口获取实时数据、控制智能设备执行操作等。

本次技术分享将聚焦智能体的记忆能力,深入探讨其定义内涵、分类方式、核心操作流程,以及当前行业内主流的技术实现方案,为读者揭开AI记忆系统的神秘面纱。

一、智能体为何需要“记忆”?

在智能体的架构体系中,记忆并非简单的“信息存储容器”,而是支撑其实现持续学习、保持行为一致性与提供个性化服务的核心基础。其核心价值主要体现在以下三个维度:

1. 打破LLM的“静态知识壁垒”,实现持续学习与优化

当前主流的大语言模型(LLM)其参数所承载的知识是“静态”的,仅包含训练数据截止时间点之前的信息,无法自主更新新的知识与经验。而记忆系统的存在,使得智能体能够将交互过程中获取的新信息(如用户反馈的错误答案、行业最新动态)、从错误中总结的经验(如某次回答偏离用户需求的原因)存储起来,并通过后续的学习机制优化自身行为,逐步提升服务能力。例如,客服智能体可通过记忆用户此前反馈的“偏好简洁回答”这一信息,调整后续的回复风格。

2. 维护长上下文交互逻辑,保障对话连贯与行为一致

在多轮对话场景中,若智能体缺乏记忆能力,会出现“答非所问”“前后矛盾”的问题——比如前一轮对话中用户已告知“自己是学生”,下一轮智能体却再次询问“您的职业是什么”。而记忆系统能够实时存储对话过程中的关键信息(如用户身份、需求偏好、已讨论的话题),并在后续交互中快速调取,确保对话逻辑连贯、行为一致,提升用户交互体验。

3. 构建用户个性化画像,提供“千人千面”的服务

通过记忆系统记录用户的历史交互数据(如咨询过的问题类型、对不同回复的满意度、使用习惯等),智能体可构建出精细化的用户个性化画像。基于该画像,智能体能够为不同用户提供定制化服务:例如,为金融行业用户优先推送财经相关资讯,为学生用户提供更通俗易懂的知识讲解,真正实现“千人千面”的服务体验。

二、智能体记忆的分类与结构:从“人脑记忆”到“AI记忆”的借鉴与创新

人类记忆的研究成果为智能体记忆系统的设计提供了重要参考。在心理学领域,经典的Atkinson-Shiffrin记忆模型将人类记忆划分为三个层次,同时也存在按内容形式划分的分类方式,这些理论为AI记忆系统的架构设计提供了灵感。

1. 人脑记忆的经典分类模型

Atkinson-Shiffrin记忆模型从“信息存储时长与作用”角度,将人类记忆分为三类:

  • 感知记忆(Sensory Memory):暂存通过感官(视觉、听觉等)获取的原始信息,存储时长极短(通常仅0.5-3秒),若未被进一步处理则会快速遗忘,例如“看到一闪而过的广告牌后残留的短暂印象”。
  • 短期记忆(Short-term Memory):用于存储当前任务处理所需的信息,容量有限(通常为7±2个组块),存储时长较短(约10-30秒),例如“临时记忆一个陌生的电话号码以便拨号”。
  • 长期记忆(Long-term Memory):用于长期存储知识、经验与技能,容量近乎无限,存储时长可从几天到终身,例如“记住自己的生日、掌握骑自行车的技能”。

此外,按“信息提取方式”,人类记忆还可分为:

  • 显式记忆(Explicit Memory):也称为“陈述性记忆”,指可用语言清晰描述、需有意识主动调取的记忆,如历史事件、数学公式、个人经历等。
  • 隐式记忆(Implicit Memory):也称为“非陈述性记忆”,指难以用语言描述、无需有意识调取即可自动应用的记忆,如打字、游泳、演奏乐器等技能类记忆。

2. 智能体记忆的分类与结构设计

借鉴人脑记忆的分层逻辑,智能体记忆系统也形成了类似的层次划分与结构设计,同时结合AI技术特性进行了创新优化。

图片

从“信息存储区域”来看,智能体记忆主要包括三大模块:

  1. 上下文(Context):相当于人脑的“短期记忆”,主要存储当前对话或任务处理过程中的临时信息,容量受LLM上下文窗口限制(如GPT-4的上下文窗口通常为8k-128k tokens),任务结束后若未主动存储则会被清空,例如“当前对话中用户提到的‘明天下午3点开会’这一临时信息”。
  2. LLM参数内知识:属于智能体的“基础长期记忆”,存储在模型参数中,是模型训练过程中习得的通用知识,但无法动态更新——若需补充新领域知识,需通过模型微调(Fine-Tuning)等方式重新训练,例如模型参数中内置的“地球是圆的”这类常识性知识。
  3. 外挂存储(External Storage):相当于智能体的“扩展长期记忆”,通过向量数据库(如Milvus、Pinecone)、知识图谱、关系型数据库等外部存储系统实现,支持动态写入与读取,可实时更新新知识、新经验,例如存储行业最新政策文件、用户历史交互记录等。

从“存储形式”来看,智能体记忆可分为两类:

  • 参数记忆(Parametric Memory):将知识融入LLM的参数中,需通过模型微调(Fine-Tuning)、指令微调(Instruction Tuning)等方式实现,例如为通用LLM注入医疗领域知识后,模型参数中便存储了医疗相关记忆。其优点是调用速度快,缺点是更新成本高、无法实时修改。
  • 非参数记忆(Non-parametric Memory):知识存储在外部系统中,无需修改LLM参数,可通过检索增强生成(RAG)、知识库查询等方式调取,例如将企业产品手册存入向量数据库,智能体在回答用户问题时实时检索相关内容。其优点是更新灵活、成本低,缺点是检索效率受存储系统性能影响。

三、智能体记忆的核心操作:从“信息输入”到“知识应用”的全流程

无论是人类记忆还是智能体记忆,其核心运作过程都围绕“信息处理与应用”展开。从技术角度来看,智能体记忆的核心操作可分为基础操作与高级操作两类,共同构成了“信息编码-存储-提取-优化”的全流程闭环。

1. 三大基础操作:编码、存储、提取

这三个操作是记忆系统的“基石”,确保信息能够被有效处理并应用于实际任务:

  • 编码(Encode):将原始输入信息(如文本、图像)转换为智能体可存储、可理解的格式。例如,对于文本信息,通过Embedding模型将其转换为高维向量;对于图像信息,通过CNN等模型提取特征向量,为后续存储与检索奠定基础。
  • 存储(Storage):根据信息的类型、重要性与使用频率,将编码后的信息存入对应的记忆区域。例如,临时对话信息存入“上下文”(短期记忆),用户长期偏好信息存入“外挂向量数据库”(长期记忆),基础常识性知识融入“LLM参数”(基础长期记忆)。
  • 提取(Retrieval):在智能体执行任务或生成回复时,根据当前需求从记忆区域中调取相关信息。例如,用户询问“我上次咨询的订单进度如何”,智能体通过检索外挂数据库中存储的“用户历史订单交互记录”,获取相关信息并生成回复。

2. 四大高级操作:巩固、再巩固、反思、遗忘

为提升记忆系统的效率与准确性,智能体还需具备以下高级操作能力,这些操作借鉴了人类记忆的“优化机制”:

  • 巩固(Consolidation):将短期记忆中的重要信息(如用户反复提及的需求、关键任务数据)转换为长期记忆,避免因短期记忆容量限制而丢失。例如,智能体将用户连续3次提到的“关注新能源行业动态”这一需求,从上下文存储到外挂知识库中。
  • 再巩固(Reconsolidation):当长期记忆中的信息被再次调取时,结合新的场景或信息对其进行更新优化。例如,智能体此前记忆“用户偏好线下购物”,但最新对话中用户提到“近期更倾向线上购物”,则通过再巩固操作更新用户偏好信息。
  • 反思(Reflection):对记忆中的历史经验(如过往任务的成功案例、错误回答记录)进行分析总结,提炼出可复用的规律或避坑指南,提升后续决策能力。例如,智能体通过反思“多次因未理解用户隐含需求导致回答偏差”的记录,优化需求解析算法。
  • 遗忘(Forgetting):删除记忆中冗余、过时或错误的信息(如过期的政策文件、用户已变更的偏好、错误的知识数据),释放存储资源,提升检索效率。例如,智能体自动删除3年前的用户交互记录(若用户无长期保留需求),或删除已被证伪的“旧知识”(如过时的产品价格)。

在实际的智能体系统中,这些操作通过具体的技术手段落地:例如,“编码”对应Embedding向量生成技术,“存储”对应向量数据库写入操作,“提取”对应向量检索与匹配算法,“巩固”对应摘要生成与长期存储同步机制,“遗忘”对应基于时间或重要性的记忆清理策略。

四、主流智能体记忆实现方案深度对比

当前行业内已涌现出多款成熟的智能体记忆技术方案,这些方案基于不同的设计理念,在架构、功能与适用场景上各有侧重。以下将对6种主流方案进行详细解析,对比其核心特性与优势。

1. MemoryBank:基于心理学理论的“类人记忆”方案

MemoryBank是较早将人类记忆心理学理论应用于智能体记忆系统的方案之一,其核心设计思路是模拟人类记忆的“生命周期管理”与“个性化适配”机制,具体特点如下:

  • 对话摘要与定期回顾机制:对多轮对话内容进行实时摘要生成,提取关键信息(如用户需求、核心观点),并设置定期回顾策略(如每日、每周),强化重要记忆的巩固效果,避免信息遗忘。
  • 遗忘曲线动态管理:借鉴艾宾浩斯遗忘曲线理论,根据信息的重要性与访问频率,动态调整记忆的“衰减速度”——重要信息(如用户核心需求)衰减慢,冗余信息(如无关对话内容)衰减快,到期后自动删除。
  • 用户画像驱动的个性化交互:通过记忆系统积累用户的历史交互数据(如回复风格偏好、关注领域、使用习惯),构建动态更新的用户画像,并基于画像调整智能体的交互策略,例如为偏好专业术语的用户提供深度技术解读。

图片

2. LETTA(原MemGPT):借鉴操作系统的“虚拟内存”方案

LETTA(前身为MemGPT)的设计灵感来源于计算机操作系统的“虚拟内存分页机制”,核心目标是突破LLM上下文窗口的容量限制,实现大规模长文本记忆的高效管理,其架构分为两大模块:

  • Main Context(主上下文):相当于操作系统的“物理内存”,存储智能体运行所需的核心信息,包括系统指令(如任务目标、交互规则)、当前对话的关键事实(如用户当前问题、已确认的信息)与近期对话记录,确保快速调取与处理。
  • External Context(外部上下文):相当于操作系统的“硬盘虚拟内存”,存储历史对话的摘要信息、较早的交互记录与非实时使用的知识数据,通过函数调用机制与Main Context实现数据交互——当Main Context需要历史信息时,通过函数调用从External Context中检索并加载相关数据。

图片

3. ZEP:面向企业场景的“时间感知知识图谱”方案

ZEP聚焦企业级智能体应用场景,提出了“时间感知的知识图谱”架构,能够有效处理企业复杂的结构化与非结构化数据,支持多维度的信息检索与推理,其架构分为三层:

  • 情境子图(Context Subgraph):存储原始的交互数据与场景信息,包括对话文本、时间戳、用户身份、交互场景(如会议、客服、培训)等,保留信息的原始上下文,为后续分析提供基础。
  • 语义子图(Semantic Subgraph):通过自然语言处理(NLP)技术从情境子图中提取实体(如企业名称、产品型号、人员职位)、关系(如“用户A购买了产品B”“会议C讨论了项目D”)与属性(如“产品B的价格为XX元”),构建结构化的语义网络。
  • 社区子图(Community Subgraph):对语义子图中的实体与关系进行高层次聚类,形成“知识社区”(如“产品系列社区”“项目团队社区”),支持跨场景、跨领域的知识关联与聚合,提升复杂推理任务的效率。

ZEP的核心优势在于支持“混合检索”——融合向量检索(匹配语义相似性)、全文检索(匹配关键词)与图遍历检索(匹配实体关系),能够快速定位企业复杂业务场景下的关键信息,在企业知识库问答、项目管理智能体等场景中表现优异。

图片

4. Mem0 & Mem0-G:开源生态下的“轻量+图谱”双方案

Mem0是当前开源社区中最受欢迎的智能体记忆框架之一,具有轻量、灵活、易集成的特点,后续推出的Mem0-G则进一步引入知识图谱技术,强化了记忆的结构化与动态更新能力,两者的核心特性如下:

  • Mem0(基础版):以“语义检索+摘要生成”为核心,支持将对话信息、用户偏好等数据转换为Embedding向量存入外部数据库(如Chroma、FAISS),在需要时通过语义检索快速调取相关记忆,并结合摘要生成技术提炼关键信息,适用于中小规模的智能体场景(如个人助手、客服机器人)。其优势在于部署成本低、集成速度快,开发者可通过简单的API调用实现记忆功能,无需深入理解复杂的底层架构。
  • Mem0-G(图谱增强版):在Mem0的基础上引入知识图谱技术,不仅支持语义检索,还能构建记忆间的关联关系(如“用户A偏好产品B”“产品B属于品类C”),并具备冲突检测与动态更新能力——当新记忆与已有记忆存在矛盾(如用户此前说“不喜欢甜食”,后又提到“爱吃蛋糕”)时,系统会自动标记冲突并提示用户确认,避免错误记忆影响决策。在LOCOMO(智能体记忆能力测试基准)中,Mem0-G在记忆准确性、检索效率与冲突处理能力上均表现突出,成为开源领域的标杆方案之一。

图片

5. MemOS:国内自主研发的“记忆立方体”方案

MemOS由国内初创公司“记忆张量”开发,近期完成亿元级天使轮融资,是国内智能体记忆领域的代表性方案。其核心创新在于提出“记忆立方体(MemCube)”的统一抽象模型,打破传统记忆系统的分层壁垒,实现多类型记忆的灵活管理,具体特性如下:

  • 三类记忆动态转换:将记忆明确划分为纯文本记忆(如原始对话记录、文档原文)、激活记忆(近期高频访问的关键信息,如用户当前关注的订单信息)与参数记忆(融入模型参数的基础知识),支持三类记忆根据访问频率、重要性动态转换——例如,“用户长期偏好”从纯文本记忆升级为激活记忆,再通过微调融入参数记忆,提升调用效率。
  • 记忆立方体(MemCube)抽象:以“维度-属性-关联”为核心构建记忆立方体,每个记忆单元包含时间、类型、优先级等多维度属性,且单元间通过关联关系形成网络。这种结构既支持单维度快速检索(如“查询近3天的交互记忆”),也支持多维度组合查询(如“查询用户A近3天关于产品B的交互记忆”),大幅提升记忆管理的灵活性。
  • 多视角记忆结构:同时支持标签视角(为记忆打标签,如“订单咨询”“技术问题”)、图谱视角(构建记忆间的实体关系)与分层视角(按重要性分层存储),适配不同场景下的检索需求——例如,客服场景用标签视角快速定位问题类型,数据分析场景用图谱视角挖掘记忆关联规律。

在国内多个智能体测试基准(如中文对话连贯性测试、企业知识问答准确率测试)中,MemOS的综合性能达到SOTA( state-of-the-art,当前最优)水平,已在金融、政务等领域的智能体项目中落地应用。

图片

6. MIRIX:多Agent协同的“精细化记忆组件”方案

与其他聚焦单智能体记忆的方案不同,MIRIX采用多Agent架构设计,将记忆系统拆解为多个专业化的记忆组件,由不同Agent分工管理,实现记忆的精细化运营,其核心设计如下:

  • 六大记忆组件分工:根据记忆内容与功能,将记忆划分为事实记忆(如“地球半径约6400公里”)、经验记忆(如“处理用户退款请求的步骤”)、偏好记忆(如“用户A喜欢早上接收推送”)、场景记忆(如“上次产品发布会的对话场景”)、规则记忆(如“客服回复需符合合规要求”)与临时记忆(如“当前对话的临时验证码”)六大组件,每个组件由专属Agent负责编码、存储与提取。
  • 多Agent协同调度:设置“记忆调度Agent”作为核心协调者,当智能体需要调取记忆时,调度Agent先分析需求类型(如“用户询问退款流程”对应经验记忆),再将请求分发至对应记忆组件的Agent,由专业Agent完成检索后返回结果。这种分工模式避免了单Agent处理所有记忆任务的效率瓶颈,提升了复杂场景下的记忆响应速度。
  • “精细路由+提取”机制:在记忆检索环节,MIRIX提出“先路由、后提取”的两步策略——路由阶段通过关键词匹配、语义分析确定目标记忆组件与具体存储位置,提取阶段结合组件特性选择最优算法(如事实记忆用精确匹配,经验记忆用语义相似匹配),确保检索结果的准确性与效率。

图片

五、智能体记忆技术的总结与未来趋势

通过对上述主流方案的分析可以发现,当前智能体记忆技术已从“单一存储”向“精细化、结构化、协同化”演进,其核心逻辑是通过更科学的记忆管理,让智能体更精准地理解需求、更连贯地交互、更高效地学习。结合行业技术发展动态,未来智能体记忆技术将呈现四大核心趋势:

1. 记忆分类的“超精细化”:从“分层”到“分场景”

当前记忆分类多基于“存储时长”(短期/长期)或“存储形式”(参数/非参数),未来将进一步结合具体应用场景实现“场景化分类”——例如,教育智能体的记忆可分为“知识点记忆”“学生学习进度记忆”“错题记忆”,医疗智能体的记忆可分为“患者病史记忆”“药品知识记忆”“诊疗流程记忆”。不同场景的记忆采用专属的编码、存储与检索策略,进一步提升记忆服务的精准度。

2. 存储结构的“混合化深化”:多结构融合成为标配

单一的向量存储或知识图谱已无法满足复杂场景需求,未来记忆系统将普遍采用“文本+向量+图谱+表格”的混合存储结构——文本存储原始信息,向量存储语义特征,图谱存储关联关系,表格存储结构化数据(如用户订单信息、设备运行参数)。例如,企业智能体可通过文本存储会议录音转写,向量存储会议语义,图谱存储参会人员与讨论议题的关联,表格存储会议决议的执行进度,实现多维度信息的统一管理。

3. 检索技术的“智能化升级”:从“被动匹配”到“主动预测”

当前记忆检索多依赖“用户查询-关键词匹配-结果返回”的被动模式,未来将引入“主动预测检索”机制——基于用户历史行为、当前场景与任务目标,提前预测用户可能需要的记忆并主动加载。例如,当用户在电商智能体中浏览“笔记本电脑”时,系统可主动调取用户此前“关注续航能力”“预算8000元”的记忆,无需用户再次提及即可推荐符合需求的产品,大幅提升交互效率。

4. 记忆管理的“动态化与自优化”:模拟人类记忆的“自适应调节”

未来记忆系统将具备更强的“自优化能力”:一方面,通过实时监控记忆的访问频率、使用效果,动态调整记忆的存储层级(如高频访问的记忆从长期记忆转为激活记忆)与保留时长(如无效记忆自动加速遗忘);另一方面,通过持续学习用户反馈,优化编码与检索算法——例如,若用户多次纠正“记忆偏差”(如系统误记用户职业),系统可自动调整编码时的特征提取权重,减少后续偏差,真正实现“记忆系统的自我进化”。

总体而言,记忆技术是智能体从“工具属性”向“智能伙伴属性”演进的关键支撑。随着技术的不断突破,未来的智能体将不仅能“记住信息”,更能“理解记忆的意义”,为用户提供更具温度、更连贯、更个性化的智能服务。

六、如何学习大模型 AI ?

由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。

但是具体到个人,只能说是:

“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。

这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。

我在一线科技企业深耕十二载,见证过太多因技术卡位而跃迁的案例。那些率先拥抱 AI 的同事,早已在效率与薪资上形成代际优势,我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在大模型的学习中的很多困惑。我们整理出这套 AI 大模型突围资料包

  • ✅ 从零到一的 AI 学习路径图
  • ✅ 大模型调优实战手册(附医疗/金融等大厂真实案例)
  • ✅ 百度/阿里专家闭门录播课
  • ✅ 大模型当下最新行业报告
  • ✅ 真实大厂面试真题
  • ✅ 2025 最新岗位需求图谱

所有资料 ⚡️ ,朋友们如果有需要 《AI大模型入门+进阶学习资源包》下方扫码获取~
在这里插入图片描述

① 全套AI大模型应用开发视频教程

(包含提示工程、RAG、LangChain、Agent、模型微调与部署、DeepSeek等技术点)
在这里插入图片描述

② 大模型系统化学习路线

作为学习AI大模型技术的新手,方向至关重要。 正确的学习路线可以为你节省时间,少走弯路;方向不对,努力白费。这里我给大家准备了一份最科学最系统的学习成长路线图和学习规划,带你从零基础入门到精通!
在这里插入图片描述

③ 大模型学习书籍&文档

学习AI大模型离不开书籍文档,我精选了一系列大模型技术的书籍和学习文档(电子版),它们由领域内的顶尖专家撰写,内容全面、深入、详尽,为你学习大模型提供坚实的理论基础。
在这里插入图片描述

④ AI大模型最新行业报告

2025最新行业报告,针对不同行业的现状、趋势、问题、机会等进行系统地调研和评估,以了解哪些行业更适合引入大模型的技术和应用,以及在哪些方面可以发挥大模型的优势。
在这里插入图片描述

⑤ 大模型项目实战&配套源码

学以致用,在项目实战中检验和巩固你所学到的知识,同时为你找工作就业和职业发展打下坚实的基础。
在这里插入图片描述

⑥ 大模型大厂面试真题

面试不仅是技术的较量,更需要充分的准备。在你已经掌握了大模型技术之后,就需要开始准备面试,我精心整理了一份大模型面试题库,涵盖当前面试中可能遇到的各种技术问题,让你在面试中游刃有余

图片

以上资料如何领取?

在这里插入图片描述

为什么大家都在学大模型?

最近科技巨头英特尔宣布裁员2万人,传统岗位不断缩减,但AI相关技术岗疯狂扩招,有3-5年经验,大厂薪资就能给到50K*20薪!

图片

不出1年,“有AI项目经验”将成为投递简历的门槛。

风口之下,与其像“温水煮青蛙”一样坐等被行业淘汰,不如先人一步,掌握AI大模型原理+应用技术+项目实操经验,“顺风”翻盘!
在这里插入图片描述
在这里插入图片描述

这些资料真的有用吗?

这份资料由我和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理,现任上海殷泊信息科技CEO,其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证,服务航天科工、国家电网等1000+企业,以第一作者在IEEE Transactions发表论文50+篇,获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。

资料内容涵盖了从入门到进阶的各类视频教程和实战项目,无论你是小白还是有些技术基础的技术人员,这份资料都绝对能帮助你提升薪资待遇,转行大模型岗位。
在这里插入图片描述
在这里插入图片描述

以上全套大模型资料如何领取?

在这里插入图片描述

Logo

更多推荐