Hermes 四种记忆的工程实现：从Episodic到Collective的全链路

AI智研团

289人浏览 · 2026-06-23 09:25:30

AI智研团 · 2026-06-23 09:25:30 发布

四种记忆的工程实现：从Episodic到Collective的全链路

本文属于「Hermes Agent自进化智能体深度解析」系列 | 模块十三 · 第2篇

人类有经历记忆、知识记忆、技能记忆、集体记忆。AI Agent也有四种——每一种都有独特的工程实现。

你记得昨天午饭吃了什么，这是Episodic Memory（情景记忆）。你知道水在100度沸腾，这是Semantic Memory（语义记忆）。你会骑自行车，这是Procedural Memory（程序记忆）。你们团队有一条不成文规矩——代码审查必须两人签名，这是Collective Memory（集体记忆）。

认知科学家把这四种记忆区分得很清楚。它们存储的内容不同、提取的方式不同、衰退的规律不同、更新的机制也不同。一个正常人四种记忆协同工作，无缝衔接——你骑车去上班（Procedural），路上回忆起昨天的会议内容（Episodic），同时运用行业知识判断项目风险（Semantic），并遵循公司的审批流程（Collective）。

Hermes Agent的自进化记忆层，完整复刻了这套认知架构。但与人类大脑的"自然演化"不同，AI的四种记忆必须被精确地工程实现——每一类记忆用什么数据结构存储、用什么算法检索、用什么策略过期、用什么机制更新，都必须给出确定性的答案。模糊地带在这里不存在，因为每一行代码都会直接影响Agent的行为。

上一篇#41我们从宏观视角拆解了自进化记忆层的架构蓝图。本篇将深入地下一层，逐一拆解四种记忆的工程实现细节——从Schema设计到索引策略，从置信度管理到冲突合并。这不是概念科普，这是可以落地的工程图纸。

一、Episodic Memory：Agent的"做了什么"

完整执行记录

Episodic Memory存储的是Agent的"经历"——每一次任务执行的完整记录。它回答的核心问题是：Agent做了什么，结果怎样？

这不是简单的日志。Trajectory Log（#24拆解过）是原始数据流，Episodic Memory是对Trajectory的结构化提炼。一条Trajectory可能有5,000行JSON Lines，提炼为一条Episodic Memory只有200行，但信息密度提升了10倍。

Schema设计

一条Episodic Memory的完整Schema如下：

索引策略

Episodic Memory的检索效率直接决定Agent在新任务面前的反应速度。Hermes使用三级索引：

第一级：标签索引（Tag Index）——基于预定义的任务类型标签，精确匹配。适用于"我需要同类任务的执行记录"这种场景。查询速度O(1)。

第二级：向量索引（Vector Index）——基于任务描述的Embedding向量，语义相似度检索。适用于"我需要语义相关但类型不同的执行记录"这种场景。使用HNSW算法，查询速度O(log n)。

第三级：时序索引（Temporal Index）——基于时间戳的范围查询。适用于"最近30天有没有类似的失败"这种场景。使用B+树，查询速度O(log n)。

三级索引可以组合使用。一个典型的查询：“过去60天内、与当前任务语义相似度>0.8、且结果为成功的Episodic Memory”。

过期清理

不是所有经历都值得永远记住。Episodic Memory有精确的生命周期管理：

注意一个关键设计：失败经历的保留时间比成功经历更长。这与#57"轨迹自进化"的理念一脉相承——失败的信噪比是成功的3倍，值得更长时间的"温养"。

二、Semantic Memory：Agent的"为什么"

结构化知识的工程载体

Semantic Memory存储的是Agent的"知识"——事实、规则、因果链、领域模型。它回答的核心问题是：为什么这样做是对的，那样做是错的？

如果Episodic Memory是"我上次烤面包用了180度30分钟"，那Semantic Memory就是"美拉德反应在140-165度之间发生，所以烤面包需要至少这个温度"。前者是经验，后者是知识。

Hermes的Semantic Memory使用知识图谱作为核心存储结构，但不是传统的自由形式图谱——它有严格的Schema约束和置信度管理。

三元组抽取

Semantic Memory的构建依赖三元组抽取管线——从Episodic Memory的经验片段中自动抽取(主体, 关系, 客体)三元组。

一条Episodic Memory中可能包含这样的经验片段：

“JWT刷新令牌应使用旋转策略”抽取过程：

但不是所有经验都适合转化为Semantic知识。抽取管线有一个质量门控：

置信度管理：知识也有保质期

与Episodic Memory不同，Semantic Memory中的知识有动态置信度——它不是写入时固定的，而是持续演化的：

这套机制确保Semantic Memory永远是"活的"——好的知识越用越可信，过时的知识自然消退。

三、Procedural Memory：Agent的"怎么做"

可复用Skills作为记忆载体

Procedural Memory存储的是Agent的"技能"——如何完成某类任务的可复用操作序列。它回答的核心问题是：怎么做才能高效可靠地达成目标？

如果Episodic Memory是"上次我做了一个蛋糕，步骤是A-B-C-D"，那Procedural Memory就是"做蛋糕的通用技能，可以适用于任何蛋糕"。

在Hermes中，Procedural Memory的直接载体就是Skills（#26-#30深度拆解过Skill体系）。但不是所有Skill都是Procedural Memory——只有那些从执行经验中自动生成或优化的Skill，才属于Procedural Memory的范畴。

人类手写的初始Skill是"种子"，Agent从执行经验中自动提炼和优化的Skill才是"真正的Procedural Memory"。

从经验自动生成Procedural Memory

Procedural Memory的生成有一个完整的工程管线：

Procedural Memory的版本演化

与Episodic和Semantic不同，Procedural Memory有明确的版本管理——每次优化产生新版本，旧版本不删除，而是标记为deprecated：

每个版本的升级都有完整的溯源链：哪个Episodic Memory触发了这次优化？哪个Semantic知识被引用？这种全链路溯源确保Procedural Memory不是黑箱——你随时可以回答"这个Skill为什么要这样设计"。

四、Collective Memory：组织的经验

多Agent共享记忆的工程挑战

Collective Memory存储的是团队和组织层面的经验——编码规范、架构决策、已知陷阱、最佳实践。它回答的核心问题是：组织作为一个整体，积累了什么？

这是四种记忆中最复杂的，因为它引入了一个前三种不需要面对的维度：多主体共识。Episodic是单个Agent的经历，Semantic是单个Agent的知识，Procedural是单个Agent的技能——它们都可以由单一Agent独立维护。但Collective Memory需要多个Agent共同构建、共同消费、共同维护。

这带来了三个核心工程挑战：权限管理、冲突合并、版本管理。

权限模型

Collective Memory使用三级权限：

READ——Agent可以消费共享记忆，但不能修改。适用于新加入团队的Agent，或跨团队只读访问。

WRITE——Agent可以向共享记忆贡献新知识，但修改已有条目需要经过审核。适用于团队成员Agent的日常操作。

ADMIN——Agent可以修改和删除已有条目，审核待提交的变更。通常由人类工程师或指定的"资深Agent"担任。

冲突合并

当多个Agent贡献了互相矛盾的知识时，Hermes使用三阶段冲突解决协议：

版本管理

Collective Memory的每条记录都有完整的版本历史：

注意版本2和版本3都是Agent自动贡献的——它们从自己的Episodic Memory中提炼出改进建议，提交到Collective Memory，经过审核后成为组织级知识。

五、四种记忆协同：一个新任务如何同时激活四种记忆

协同激活流程

四种记忆不是孤立运作的。当一个新任务到来时，Hermes的Context Engine会同时激活四种记忆，让它们协同为当前任务提供全方位支撑。

协同规则

四种记忆的注入不是简单的"全部灌进去"——那会撑爆上下文窗口。Hermes使用优先级仲裁机制决定每种记忆注入什么、注入多少：

震撼时刻：四种记忆合力，第一次就87%

来看一个真实的数字对比。

一个没有记忆的Agent——纯靠Prompt和模型能力执行任务。面对"为支付模块实现退款API"这个任务，它知道API的一般写法，但不知道你们团队用什么错误处理格式、不知道上次做支付API时踩了什么坑、不知道退款需要幂等性保证、不知道你们团队要求使用Saga模式。

它的成功率：约60%。失败原因很典型——没遵循团队规范、重复踩了已知的坑、缺少关键的领域知识。

现在，同一个Agent，但四种记忆全部在线：

Episodic Memory检索到3条高度相关的历史执行记录：

EP-20260528-0031：“上次做支付API时遇到并发问题，解决方案是…”
EP-20260520-0027：“退款逻辑曾因缺少幂等性导致重复退款”
EP-20260515-0019：“支付模块的数据库迁移需要特别小心”

Semantic Memory匹配到5条高置信度知识：

“金额操作必须包含审计日志”（置信度0.96）
“退款操作需要幂等性保证”（置信度0.94）
“并发场景下需要分布式锁”（置信度0.91）
“PostgreSQL的SERIALIZABLE隔离级别可防止并发退款”（置信度0.88）
“支付模块的错误信息不能包含敏感数据”（置信度0.95）

Procedural Memory自动加载最优Skill：

safe_api_endpoint_implementation v2.0
——六步流程，集成分布式锁经验，历史成功率93%

Collective Memory注入团队编码规范：

CM-009：“API错误处理统一格式，包含request_id”
CM-015：“支付模块必须使用Saga模式进行补偿事务”
CM-022：“所有金额字段使用Decimal类型，禁止浮点数”

四种记忆合力注入上下文，Agent在第一次执行就产出了一份几乎不需要修改的实现方案——遵循团队规范、避开了已知的坑、使用了最优的执行路径、包含了所有必要的领域知识。

最终结果：成功率87%。比无记忆版本提升了27个百分点。

这不是魔法，这是工程。每一种记忆都在自己最擅长的维度上贡献了关键信息：Episodic提供了"上次怎么做的"参考，Semantic提供了"为什么这样做"的知识，Procedural提供了"怎么做最可靠"的技能，Collective提供了"组织要求怎么做"的规范。

而更震撼的是——随着执行次数增加，四种记忆会持续积累和优化。100次执行后，成功率可能稳定在92%。1000次后，可能达到96%。这就是复利的力量——每一次执行都在为下一次执行积累势能。

总结与预告

本篇拆解了Hermes自进化记忆层中四种记忆的完整工程实现：

Episodic Memory
：结构化执行记录，三级索引（标签+向量+时序），分层过期清理
Semantic Memory
：知识图谱存储，三元组自动抽取，动态置信度管理
Procedural Memory
：Skills作为记忆载体，从经验自动生成，完整的版本演化链
Collective Memory
：三级权限模型，三阶段冲突解决，完整的版本溯源

四种记忆通过Context Engine的优先级仲裁机制协同工作，确保新任务获得全方位的记忆支撑。这不是概念——这是已经落地的、有Schema定义、有算法实现、有性能指标的工程系统。

下一篇#43，我们将深入Semantic Memory的底层引擎——知识图谱。从节点建模到图查询、从增量更新到跨图谱融合，拆解支撑Semantic Memory运转的核心基础设施。知识图谱不是可选组件——它是自进化Agent从"有记忆"到"有智慧"的关键跃迁。

专题信息

主题：AI原生Hermes自进化智能体系统
时间：2026年7月4-5日（周末）
形式：线上直播
内容方向：AI原生架构 · Hermes智能体拆解 · 全栈扩展 · 智能自动化 · 产品级实战 · Context Engine · 自进化数据层
17812293731

龙虾开发者社区

小龙虾开发者社区是 CSDN 旗下专注 OpenClaw 生态的官方阵地，聚焦技能开发、插件实践与部署教程，为开发者提供可直接落地的方案、工具与交流平台，助力高效构建与落地 AI 应用

更多推荐

新兴通话场景中音频3A技术的升级路径

我们这前讨论过webrtc中3A技术现状与局限，现在AI agent语音交互技术，公共场景的智能对话机器人，娱乐互动等实时交互热门技术落地离不开音频3A能力的支持。WebRTC 的 3A（AEC 回声消除、AGC 自动增益控制、ANS 噪声抑制）音频处理模块虽然已经非常成熟，但在多个新兴通话场景中仍存在。后续我会进一步展开某个具体方向，比如 AI-AEC、AI-NS抑制的实时推理优化进行分享，还有

龙虾开发者社区

【AI Agent工程化】工具会调用不等于能上线：参数契约、权限边界、幂等与回放测试

龙虾开发者社区

[智能体-544]：Hermes Agent 双重定位：既是完整可直接运行的成品智能体，同时也是通用智能体开发 / 运行框架

官方、技术社区统一归类为开源自托管 AI Agent 框架底层基于封装了完整智能体运行时、记忆调度、任务循环、工具插件、MCP 网关、多消息渠道、定时任务等标准化底层能力；提供插件扩展、自定义技能、多子智能体派生、模型路由、持久化存储等扩展接口，开发者可以基于它二次改造、定制专属智能体、嵌入自有系统；具备完整分层架构（记忆层、技能层、自进化循环、网关层），是一套通用智能体生产底座，和 Dify、L