Memento框架：无需更新权重的大模型记忆增强学习技术！

Memento是一个创新的框架，通过记忆增强方式对大语言模型(LLM)代理进行微调而无需更新模型权重。它将成功与失败轨迹记录到"案例库"中，通过价值检索指导规划和执行，实现低成本、可迁移的持续学习。该框架采用两阶段规划-执行循环，提供全面的工具生态系统，并在多个基准测试中取得竞争性性能表现。

程序员王饱饱

584人浏览 · 2025-10-11 07:15:00

程序员王饱饱 · 2025-10-11 07:15:00 发布

Memento 是一个创新的框架，旨在通过记忆增强的方式对大型语言模型（LLM）代理进行微调，而无需更新模型权重。其核心概念是“从经验中学习，而非梯度”，通过将成功与失败的轨迹记录到“案例库”中，并通过价值检索来指导规划和执行，实现低成本、可迁移且在线的持续学习。

关键特点

无需更新LLM权重：Memento 将持续学习重新定义为基于记忆的在线强化学习，通过记忆增强的马尔可夫决策过程（MDP）实现。神经案例选择策略引导动作，经验通过高效的读写操作存储和重用。
两阶段规划-执行循环：基于案例推理（CBR）的规划器将任务分解并检索相关案例，执行器则将每个子任务作为MCP客户端运行，并协调工具并写回结果。
全面的工具生态系统：通过统一的MCP接口，支持网络搜索、文档处理、代码执行、图像/视频分析等多种功能。
强大的基准性能：在GAIA、DeepResearcher、SimpleQA和HLE等基准测试中取得了竞争性结果。

架构

核心组件：包括元规划器（Meta-Planner）、执行器（Executor）、案例记忆（Case Memory）和MCP工具层。
工具生态系统：涵盖网络研究、文档处理、代码执行、数据分析和媒体分析等多个领域。

快速启动

安装：支持通过uv快速安装，需要Python 3.11+和OpenAI API密钥等。
环境变量配置：需要配置多个API密钥和服务端点。
SearxNG设置：用于网络搜索功能。
基本使用：提供交互模式和命令行模式。

性能

基准测试结果：在多个基准测试中表现出色，例如GAIA测试集上达到79.40%的通过率。
关键见解：小型、高质量的内存效果最佳，规划+CBR一致提升性能。

如何学习AI大模型？

如果你对AI大模型入门感兴趣，那么你需要的话可以点击这里大模型重磅福利：入门进阶全套104G学习资源包免费分享！

这份完整版的大模型 AI 学习和面试资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

在这里插入图片描述

这是一份大模型从零基础到进阶的学习路线大纲全览，小伙伴们记得点个收藏！

请添加图片描述
第一阶段： 从大模型系统设计入手，讲解大模型的主要方法；

第二阶段： 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用；

第三阶段： 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统；

第四阶段： 大模型知识库应用开发以LangChain框架为例，构建物流行业咨询智能问答系统；

第五阶段： 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型；

第六阶段： 以SD多模态大模型为主，搭建了文生图小程序案例；

第七阶段： 以大模型平台应用与开发为主，通过星火大模型，文心大模型等成熟大模型构建大模型行业应用。

100套AI大模型商业化落地方案

请添加图片描述

大模型全套视频教程

请添加图片描述

200本大模型PDF书籍

请添加图片描述

👉学会后的收获：👈

• 基于大模型全栈工程实现（前端、后端、产品经理、设计、数据分析等），通过这门课可获得不同能力；

• 能够利用大模型解决相关实际项目需求：大数据时代，越来越多的企业和机构需要处理海量数据，利用大模型技术可以更好地处理这些数据，提高数据分析和决策的准确性。因此，掌握大模型应用开发技能，可以让程序员更好地应对实际项目需求；

• 基于大模型和企业数据AI应用开发，实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能，学会Fine-tuning垂直训练大模型（数据准备、数据蒸馏、大模型部署）一站式掌握；

• 能够完成时下热门大模型垂直领域模型训练能力，提高程序员的编码能力：大模型应用开发需要掌握机器学习算法、深度学习框架等技术，这些技术的掌握可以提高程序员的编码能力和分析能力，让程序员更加熟练地编写高质量的代码。

LLM面试题合集

请添加图片描述

大模型产品经理资源合集

请添加图片描述

大模型项目实战合集

请添加图片描述

👉获取方式：
😝有需要的小伙伴，可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

在这里插入图片描述

北京朝阳AI社区

更多推荐

cover

AI算法人才缺口巨大！5岗抢2人，掌握大模型技能解锁高薪新赛道（干货收藏）！

北京朝阳AI社区

cover

【万字长文】AIGC大模型从零基础到精通：最详细实践总结，一篇文章搞定（建议收藏）！

北京朝阳AI社区

cover

大模型技术全景解析：RAG、Prompt优化、Agent架构与微调实战指南

北京朝阳AI社区

所有评论(0)

查看更多评论

程序员王饱饱

@weixin_55154866

已为社区贡献100条内容