Token 不够用?先搞懂 OpenClaw 的上下文窗口到底装了什么!
更深入的分解:每个文件、每个工具 schema 大小、每个 Skills 条目大小和系统提示词大小。(OpenClaw 构建):规则、工具、Skills 列表、时间/运行时,以及注入的工作区文件。token 可以立即运行(例如:“hey /status”),并在模型看到剩余文本之前被剥离。= 当没有运行报告存在时(或通过不生成报告的 CLI 后端运行时)即时计算。= 从最后一次嵌入式(具有工具能力
点击下方“JavaEdge”,选择“设为星标”
第一时间关注技术干货!
本文已收录在Github,关注我,紧跟本系列专栏文章,咱们下篇再续!
-
🚀 魔都架构师 | 全网30W技术追随者
-
🔧 大厂分布式系统/数据中台实战专家
-
🏆 主导交易系统百万级流量调优 & 车联网平台架构
-
🧠 AIGC应用开发先行者 | 区块链落地实践者
-
🌍 以技术驱动创新,我们的征途是改变世界!
-
👉 实战干货:编程严选网
0 前言
“上下文”是 OpenClaw 在一次运行中发送给模型的所有内容。受模型的上下文窗口(token 限制)约束。新手心智模型:
-
系统提示词(OpenClaw 构建):规则、工具、Skills 列表、时间/运行时,以及注入的工作区文件。
-
对话历史:你的消息 + 助手在此会话中的消息。
-
工具调用/结果 + 附件:命令输出、文件读取、图片/音频等
上下文与”记忆”(memory)不是同一回事:
-
记忆可存储在磁盘上并稍后重新加载
-
上下文是模型当前窗口内的内容
1 检查上下文
/status
快速查看”我的窗口有多满?” + 会话设置。
🦞 OpenClaw 2026.3.13 (61d171a)
🧠 Model: lmstudio/qwen/qwen3.5-35b-a3b · 🔑 api-key (models.json)
🧮 Tokens: 114k in / 3.9k out · 💵 Cost: $0.0000
📚 Context: 69k/131k (53%) · 🧹 Compactions: 0
🧵 Session: agent:main:main • updated just now
⚙️ Runtime: direct · Think: off
🪢 Queue: collect (depth 0)
/context list
注入了什么 + 大致大小(每个文件 + 总计)。
🧠 Context breakdown
Workspace: /Users/javaedge/.openclaw/workspace
...
Inline shortcut: a command token inside normal text (e.g. “hey /status”) that runs immediately (allowlisted senders only) and is stripped before the model sees the remaining message.
/context detail
更深入的分解:每个文件、每个工具 schema 大小、每个 Skills 条目大小和系统提示词大小。
🧠 Context breakdown (detailed)
Workspace: /Users/javaedge/.openclaw/workspace
...
Session tokens (cached): 69,499 total / ctx=131072
Inline shortcut: a command token inside normal text (e.g. “hey /status”) that runs immediately (allowlisted senders only) and is stripped before the model sees the remaining message.
/usage tokens
在正常回复后附加每次回复的使用量页脚。
Session Usage
Input: 114.3k tokens
Output: 3.9k tokens
Total: 69.5k tokens
Context: 87% of 131.1k
Model: qwen/qwen3.5-35b-a3b
/compact
将较旧的历史总结为紧凑条目以释放窗口空间。
另请参阅:斜杠命令、Token 使用与成本、压缩。
数值因模型、提供商、工具策略和工作区内容而异。
2 什么计入上下文窗口
模型接收的所有内容都计入,包括:
-
系统提示词(所有部分)
-
对话历史
-
工具调用 + 工具结果
-
附件/转录(图片/音频/文件)
-
压缩摘要和修剪产物
-
提供商”包装器”或隐藏头部(不可见,仍然计数)
3 OpenClaw 如何构建系统提示词
系统提示词由 OpenClaw 拥有,每次运行时重建。它包括:
-
工具列表 + 简短描述。
-
Skills 列表(仅元数据;见下文)。
-
工作区位置。
-
时间(UTC + 如果配置了则转换为用户时间)。
-
运行时元数据(主机/操作系统/模型/思考)。
-
在项目上下文下注入的工作区引导文件。
完整分解:系统提示词。
4 注入的工作区文件(项目上下文)
默认情况下,OpenClaw 注入一组固定的工作区文件(如果存在):
-
AGENTS.md -
SOUL.md -
TOOLS.md -
IDENTITY.md -
USER.md -
HEARTBEAT.md -
BOOTSTRAP.md(仅首次运行)
大文件按文件使用 agents.defaults.bootstrapMaxChars(默认 20000 字符)截断。/context 显示原始 vs 注入大小以及是否发生了截断。
5 Skills:注入的内容 vs 按需加载的内容
系统提示词包含一个紧凑的 Skills 列表(名称 + 描述 + 位置)。此列表有实际开销。Skill 指令默认不包含。模型应该仅在需要时read Skill 的 SKILL.md。
6 工具:有两种成本
工具以两种方式影响上下文:
-
系统提示词中的工具列表文本(你看到的”Tooling”)。
-
工具 schema(JSON)。这些发送给模型以便它可以调用工具。它们计入上下文,即使你看不到它们作为纯文本。
/context detail 分解最大的工具 schema,以便你可以看到什么占主导。
7 命令、指令和”内联快捷方式”
斜杠命令由 Gateway 网关处理。有几种不同的行为:
独立命令:仅为 /... 的消息作为命令运行。
指令:
/think
/verbose
/reasoning
/elevated
/model
/queue
在模型看到消息之前被剥离。
-
仅指令消息会持久化会话设置。
-
正常消息中的内联指令作为每条消息的提示。
-
内联快捷方式(仅允许列表中的发送者):正常消息中的某些
/...token 可以立即运行(例如:“hey /status”),并在模型看到剩余文本之前被剥离。
详情:斜杠命令。
8 会话、压缩和修剪(什么会持久化)
什么在消息之间持久化取决于机制:
-
正常历史在会话记录中持久化,直到被策略压缩/修剪。
-
压缩将摘要持久化到记录中,并保持最近的消息不变。
-
修剪从运行的内存中提示词中删除旧的工具结果,但不重写记录。
文档:会话、压缩、会话修剪。
9 /context实际报告什么
/context 在可用时优先使用最新的运行构建的系统提示词报告:
-
System prompt (run)= 从最后一次嵌入式(具有工具能力的)运行中捕获,并持久化在会话存储中。 -
System prompt (estimate)= 当没有运行报告存在时(或通过不生成报告的 CLI 后端运行时)即时计算。
无论哪种方式,它都报告大小和主要贡献者;它不会转储完整的系统提示词或工具 schema。
编程严选网:
http://www.javaedge.cn/专注分享AI时代下软件开发全场景最新最佳实践~
更多推荐

所有评论(0)