Spring AI Alibaba ReactAgent 历史对话生成摘要，防止超出大模型上下文

DavidSoCool

222人浏览 · 2026-05-09 10:18:49

DavidSoCool · 2026-05-09 10:18:49 发布

接着前面的内容: https://blog.csdn.net/DavidSoCool/article/details/160857790

这次在构建ReactAgent的时候增加了SummarizationHook,用于摘要多轮历史对话,防止上下文超出大模型窗口

// 构建React Agent
        ReactAgent build = ReactAgent.builder()
                .name("ai_agent")
                .model(chatModel)
                .tools(new WeatherTool().toolCallback(), new SearchTool().toolCallback())
                .systemPrompt("""
                        你是一个博学的智能聊天助手，必须调用工具获取信息，不能编造答案。
                        调用工具后，根据结果回答用户。
                        """)
                // 添加对话记忆，使用redis保存对话记忆
                .saver(RedisSaver.builder().redisson(redissonClient).build())
                // 添加摘要钩子，用于对话摘要，防止对话过长超过模型窗口
                .hooks(SummarizationHook.builder()
                        .model(chatModel) // 专用摘要模型，这里用的同一个，可以换一个专门做摘要的模型
                        .maxTokensBeforeSummary(4000) // 触发阈值（模型窗口的70%）
                        .messagesToKeep(10) // 保留最近10轮原始对话
                        .build())
                .interceptors(messageFilterInterceptor)
                .build();

多次调用接口后,触发了历史对话摘要

使用的记忆存储方式是redis,发现下图中的key会一直增大,经过查资料得知,里面存着该会话所有的历史记录.

为什么用了SummarizationHook，Key 的大小还在涨？
这里面有坑：
1. SummarizationHook 不负责 “清理历史快照”
Hook 只做了一件事：把内存里的对话上下文压缩成摘要，让 LLM 后续请求只携带精简的上下文。
但它不会主动清理 Redis 里的历史检查点数据。Redis 里存的是每一轮对话的状态快照（每轮对话都会生成新的 checkpoint），这些旧快照不会被自动删除，只会越积越多。
简单说：Hook 帮你 “瘦身了当前会话的上下文”，但 Redis 里的 “历史快照档案” 还在持续堆积。
2. RedisCheckpointSaver 默认没有 TTL 过期策略
从截图里能看到，这个 Key 的 TTL 是 -1 永不过期,所有会话的检查点数据会永久驻留，最终导致 Redis 内存溢出。
GitHub 上也有相关 PR 专门解决这个问题：feat: add TTL configuration support for RedisSaver。

https://github.com/alibaba/spring-ai-alibaba/pull/4564

#4564 是在 2026 年 4 月 22 日合并到 main 分支的,目前还没有办法使用.
3. 摘要数据本身也会持续增长
摘要只是把多轮对话压缩成了一段文本，但对话还在继续，每一轮新的交互都会生成新的状态快照, 里面包含最新的摘要 + 新消息。
摘要会随着对话轮次增加而不断变长，所以即使没有旧快照堆积，单个会话的 Key 大小也会缓慢增长。

总结:

需要在使用redis时设置一个合理的时间或者在会话过期时主动删除它.

亚马逊云科技技术品牌专区

更多推荐

2026年，讯飞星火海外访问中转方案究竟有何独特之处？

亚马逊云科技技术品牌专区

Java分布式架构设计方法

服务拆分后，服务间的通信成为关键。事件驱动架构是另一种有效解耦和数据同步的方式，服务通过发布/订阅领域事件进行通信，借助Apache Kafka或RabbitMQ等消息中间件，可以实现事件的可靠传递与异步处理，提升系统整体响应能力。从业务拆分出发，选择恰当的通信与治理模式，妥善处理数据一致性，并构建完善的运维支撑体系。随着云原生理念的深入，Serverless、Service Mesh等新技术也在

亚马逊云科技技术品牌专区

分布式事务尝试取消确认模式的具体实现步骤

首先需要事务协调器（Transaction Coordinator），负责协调整个分布式事务的流程，记录事务状态，并在必要时触发补偿操作。尝试取消确认模式（Try-Cancel-Confirm，简称TCC）作为一种补偿型分布式事务解决方案，通过业务逻辑层面的拆解，提供了更灵活的一致性实现方式。未来，随着事务中间件的成熟和云原生技术的发展，TCC模式的实施成本将进一步降低，应用场景也将更加广泛。Co