Headroom：AI Agent 的上下文压缩层

haixiaoweb416

124人浏览 · 2026-06-22 09:27:11

haixiaoweb416 · 2026-06-22 09:27:11 发布

文章目录

Headroom：AI Agent 的上下文压缩层

Headroom：AI Agent 的上下文压缩层

AI 编程工具用得越多，token 费用越高。上下文窗口就那么大，日志、工具输出、RAG 检索结果一股脑塞进去，很快就撑满了。Headroom 解决的就是这个问题。

正文顶部截图

Headroom 是一个本地运行的上下文压缩层，截获 AI Agent 发给大模型的所有内容，压缩后再送出去。实测数据：10,144 个 token 压缩到 1,260 个，诊断结果不变。

项目拿到了超过 23,000 个 Star，支持 Python 和 TypeScript 两种语言。

它能压缩什么

Agent 工作时产生的内容都可以压缩：工具调用的返回值、终端日志、RAG 检索到的文档片段、本地文件内容、对话历史。覆盖 JSON、代码、纯文本、图片等常见格式。

六种压缩算法

Headroom 内置了六种压缩器，根据内容类型自动选择：

SmartCrusher 处理 JSON 数据，把冗长的数组和嵌套对象精简到最小体积。CodeCompressor 基于 AST 分析，支持 Python、JavaScript、Go、Rust、Java、C++。Kompress-base 是在 HuggingFace 上训练的专用模型，针对 Agent 场景的文本压缩。CacheAligner 稳定 prompt 前缀，让 Anthropic 和 OpenAI 的 KV Cache 真正命中。图片压缩通过 ML 路由器实现，压缩率 40% 到 90%。CCR 负责可逆压缩，原始内容缓存在本地，大模型需要时可以随时取回。

四种接入方式

库模式：Python 调用 compress(messages)，TypeScript 调用 await compress(messages, { model })，嵌入现有应用。
代理模式：headroom proxy --port 8787，零代码改动，任何语言都能用。
Agent 包装：headroom wrap claude 一条命令搞定，也支持 Codex、Cursor、Aider、Copilot CLI。
MCP 服务端：提供 headroom_compress、headroom_retrieve、headroom_stats 三个工具，任何 MCP 客户端都能调用。

README区域截图

压缩效果

官方给出了几组真实工作负载的数据：代码搜索场景 17,765 token 压到 1,408，节省 92%；SRE 故障排查场景 65,694 压到 5,118，同样 92%；GitHub Issue 分类 54,174 压到 14,761，节省 73%。

准确率方面，GSM8K 数学基准压缩前后得分完全一致，TruthfulQA 事实性基准还略有提升。

跨 Agent 记忆

多个 Agent 之间可以共享压缩后的上下文。Claude、Codex、Gemini 各自工作的记忆会自动去重合并，避免重复压缩同一段内容。

headroom learn 命令可以从失败的会话中提取经验，自动写入 CLAUDE.md 或 AGENTS.md 等配置文件，下次遇到类似场景时 Agent 会参考这些修正。

安装

pip install "headroom-ai[all]"    # Python
npm install headroom-ai           # Node / TypeScript

然后选一种模式启动：

headroom wrap claude              # 包装 coding agent
headroom proxy --port 8787        # 代理模式，零改动

项目使用 Apache 2.0 开源协议，完整文档在 headroom-docs.vercel.app。

龙虾开发者社区

小龙虾开发者社区是 CSDN 旗下专注 OpenClaw 生态的官方阵地，聚焦技能开发、插件实践与部署教程，为开发者提供可直接落地的方案、工具与交流平台，助力高效构建与落地 AI 应用

更多推荐

OpenClaw 本地 AI Agent 框架完整部署与使用教程

夸克网盘分享OpenClaw 是开源 AI 自动化代理框架，由开发者 Peter Steinberger 开发，2026 年 1 月底正式发布上线，短时间 GitHub Star 突破 14.5 万。框架核心定位区别于常规对话式 AI，主打可持续后台自主任务执行，可主动操控本地文件、浏览器、系统命令等资源，具备长期记忆能力，能够自主拆解多步骤任务并闭环执行，无需人工持续交互。

龙虾开发者社区

山东大学软件学院创新实训——MarketClaw（八）：从功能点到平台——我的整合视角

龙虾开发者社区

近期使用Claude Code + Opus4.7设计开发了一个开源项目：Qianyuan AI Agentic Framework

当某个 Skill 被选中时，它的工具会进入 LLM tools，，避免多个 MCP Server 之间的工具名冲突。当该 Skill 被选中时，Markdown 正文会注入系统提示。、目录中的 Markdown Skill、以及外部 MCP Server 暴露的工具。免责声明：本内容来自平台创作者，博客园系信息发布平台，仅提供信息存储空间服务。每轮都会重新计算活动 Skill 集合，所以"渐进式