大家好,我是玄姐。

PS:

Hermes 架构干货直播,欢迎点击预约,直播见。

2026 年初,OpenClaw 彻底出圈,在技术圈乃至大众层面掀起了一场“全民养虾(🦞)热”。但在各种“跑通 Demo”和“安装攻略”的狂欢背后,我们更应该冷静下来,透过源码去剖析这只“小龙虾”的骨架。

OpenClaw 并非凭空诞生的全新物种,而是近年来 Agent 关键技术的集大成者。它将动态 Prompt、上下文压缩、记忆管理、渐进式技能、Hook 机制以及端侧(Computer Use)的安全控制进行了系统性升华。

本文将跳出繁琐的前后端工程实现,直接切入现代 AI 系统的三大核心阶段:Prompt Engineering(怎么说)、Context Engineering(看什么)、Harness Engineering(在哪跑),探讨如何将这些经过验证的设计哲学应用到企业级 Agent 和业务落地中。

维度一:Prompt Engineering 从静态文本到动态组装

在 2023 年,写 Prompt 还是“小作文”大赛;但在 2026 年的成熟 Agent 系统中,Prompt Engineering 已经演变成了一套复杂的结构化动态组装机制。

1. 像搭积木一样拼装 System Prompt

OpenClaw 不再使用硬编码的静态提示词,而是基于数十个参数、分为 23 个独立模块进行动态拼接。系统会根据场景(完整模式、精简模式、极简模式)决定加载哪些模块。

核心模块的组装逻辑包括:

  • 绝对核心:身份标识(你是谁)、运行时环境(系统信息)。

  • 动态加载:工具清单、安全红线(“思想钢印”:不越权、不泄密、服从人类)、文件沙箱路径。

  • 条件注入:如果系统有记忆工具,才加载“记忆召回”规则;如果用户处于群聊,才加载“表情回复”策略。

2. Markdown 驱动的文件注入机制

这是 OpenClaw 最精妙的设计之一:将核心设定从代码中解耦,用 Markdown 文件管理,并通过文件系统动态读取注入。这种方式不仅利于版本控制,还极其方便解析。

  • AGENT.md(总纲):定义了 Agent 的底层行为逻辑,比如“好记性不如烂笔头(Text > Brain)”,以及在群聊中“重质量而非数量(Quality > quantity)”的发言规则。

  • SOUL.md(灵魂):这是赋予 AI “人设”的关键小传。它规定了 Agent 的性格、语气和价值观,确保每个 OpenClaw 实例都能千人千面。

  • USER.md(主人):记录用户的偏好、时区和习惯。

  • TOOLS.md(兵器谱):记录当前环境下的定制化工具配置(如特定的 SSH 地址、摄像头名称)。

  • HEARTBEAT.md(心跳任务):赋予 Agent “主动意识”,定义它在后台闲置时该去巡检什么(邮件、日历等)。

3. 极简主义:质量大于数量

在 Prompt 措辞上,OpenClaw 摒弃了冗长的条件声明,用词极为干练。例如,用一句 Ask anything you're uncertain about 替代复杂的异常处理说明。这种极简风格不仅让大模型遵循得更好,更重要的是为业务数据省出了极其宝贵的 Token 空间。

维度二:Context Engineering 扩展、压缩与记忆

Prompt 决定了 Agent 的智商,而 Context 决定了它能处理多复杂的任务。Context Engineering 的核心难题是:如何对抗上下文窗口爆炸与“Lost in the Middle(中间遗忘)”现象?

1. 渐进式披露的 Skills 机制

为了避免一次性塞入所有能力导致 Token 爆炸,OpenClaw 采用了按需加载的思路。默认只保留基础工具,当大模型判断需要特定能力时,才会去读取对应的 SKILL.md。这赋予了 Agent 近乎无限的能力边界,同时保持了轻量级的上下文。

2. 上下文压缩(Compaction)与修剪(Pruning)

一场长对话就像一场开卷考试,你不能把整本书带进考场,必须学会提炼知识。

注:OpenClaw 的压缩算法设计了极强的兜底逻辑,包括自适应分块、多阶段摘要,甚至在超时或失败时会返回默认的安全文本,以确保业务主流程不断裂。

3. 抵抗“失忆”的双层 Memory 系统

为了防止大模型“睡一觉就忘”,OpenClaw 构建了长短结合的记忆引擎,并通过 BM25 + 向量检索实现精准召回。

维度三:Harness Engineering 约束与引导控制

如果 Agent 是一匹千里马,Prompt 是告诉它去哪,Context 是给它看地图,那么Harness Engineering(脚手架/驾驭工程)就是给它套上马具。它通过外部机制约束大模型的“野性”,防止其跑偏或失控。

1. Harness 与 Workflow 的本质区别

许多人容易混淆这两个概念。它们的根本分歧在于主导权在谁手里:

  • Workflow(业务流):主导权在“人”。开发者画好固定的流程图(A -> B -> C),大模型只是流水线上的操作工。优点是极度可控,缺点是毫无变通能力,遇错即崩。

  • Harness(驾驭网):主导权在“AI”。大模型依然自主规划路径、调用工具、自我反思。但框架在四周拉起了护栏(比如必须先测试再提交、必须符合某类格式)。这是一种“软约束”,旨在让 AI 带着镣铐跳出最美的舞。

2. 全生命周期的 Hook 机制

OpenClaw 允许开发者在 Agent 运行的关键节点“插桩”。例如:

  • before_tool_call:拦截并校验模型生成的参数。如果模型瞎编了一个非法的实例 ID,Hook 可以直接将其打回并报错,迫使模型自我纠正,而不是让错误流转到真实的服务器环境。

  • after_tool_call:对敏感数据进行脱敏后处理。

3. 纵深防御的安全沙箱

在允许大模型操作本地电脑(Computer Use)的场景下,安全是重中之重。OpenClaw 构建了三层防护:

  • 文件沙箱:将大模型死死锁在指定的 Workspace 目录,禁止越界访问系统根目录。

  • 命令沙箱:通过白名单限制可执行的 Shell 命令。涉及高危操作时,强制熔断并触发“Ask 模式”,要求人类介入审批(Human-in-the-Loop)。

  • 网络沙箱:严控数据出口,防止恶意 Skills 或被 Prompt 注入后私自将用户隐私数据外发。

结语

OpenClaw 的迭代仍在狂奔,但对我们而言,跟风体验只是皮毛。真正的价值在于将其设计理念“化为己用”:

不要照搬形态,要提取方法。特别是在 To B 的企业级应用中,我们更需要 OpenClaw 这种通过模块化 Prompt 控制发散、通过双层 Memory 和智能压缩对抗 Token 焦虑、通过严密的 Harness 机制保障执行确定性的系统架构能力。这才是让通用大模型真正能下地干活的核心密码。

PS:

Hermes 架构干货直播,欢迎点击预约,直播见。

—1—

加我微信

扫码加我👇有很多不方便公开发公众号的我会直接分享在朋友圈,欢迎你扫码加我个人微信来看👇

图片

加星标★,不错过每一次更新!

⬇戳”阅读原文“,立即预约!

Logo

小龙虾开发者社区是 CSDN 旗下专注 OpenClaw 生态的官方阵地,聚焦技能开发、插件实践与部署教程,为开发者提供可直接落地的方案、工具与交流平台,助力高效构建与落地 AI 应用

更多推荐