OpenClaw 架构核心深度解析:当 AI 真正拥有“双手“
OpenClaw 的整体架构采用 **"网关-节点-渠道"三层解耦设计**,以 Gateway 为神经中枢,将智能推理、任务编排与交互渠道彻底分离。
从一条消息到一次任务执行,拆解 OpenClaw 的每一层设计哲学。
一、全局架构总览
OpenClaw 的整体架构采用 "网关-节点-渠道"三层解耦设计,以 Gateway 为神经中枢,将智能推理、任务编排与交互渠道彻底分离。
二、一条消息的完整旅程
当你在 Telegram 中对 OpenClaw 说:“帮我把桌面上的 PDF 按日期分类整理”,系统内部会依次经历 6 个关键环节:
各环节详解
| 环节 | 组件 | 核心职责 |
|---|---|---|
| 1️⃣ 消息接收 | Channel Adapter | 将不同平台的消息格式统一为内部标准格式,提取文本、图片、文件等附件 |
| 2️⃣ 网关路由 | Gateway | 接收标准化消息,根据来源渠道和用户身份进行精准路由 |
| 3️⃣ 会话管理 | Session Manager | 匹配已有会话或创建新会话,注入历史上下文和用户记忆 |
| 4️⃣ 模型推理 | Agent Loop → LLM | 构建完整 Prompt 并调用大模型,获取推理结果 |
| 5️⃣ 工具执行 | Tool Caller | 解析 tool_calls,在 Docker 沙箱或本地环境中执行操作 |
| 6️⃣ 结果返回 | Gateway → Channel | 将最终结果通过原渠道返回给用户 |
三、五大核心组件深度拆解
3.1 Gateway 网关:系统的神经中枢
Gateway 是 OpenClaw 最核心的组件,基于 Node.js v22+ 构建,以守护进程形式在后台持续运行。
关键设计要点:
- WebSocket 全双工通信:所有渠道通过统一的 WebSocket 连接与 Gateway 交互,使用
req/res/event三种消息类型 - TypeBox Schema 严格校验:所有消息遵循 TypeBox 定义的 JSON Schema,确保数据一致性
- Lane 消息队列:基于队列的并发控制机制,防止消息乱序,确保同一会话内的消息按序处理
- 动态路由表:每个连接的节点会声明自身能力(如"我有摄像头"、“我能发通知”),Gateway 维护能力到连接的映射
连接握手流程:
3.2 Agent Loop:智能体事件循环
Agent Loop 是 OpenClaw 的 核心执行引擎,它不是简单的"发消息→收回复",而是一个完整的事件驱动循环。
源码模块对应关系(src/agents/pi-embedded-runner/):
| 文件 | 职责 |
|---|---|
run.ts |
主运行入口,启动 Agent Loop |
attempt.ts |
单次执行尝试,包含重试逻辑 |
system-prompt.ts |
系统提示词动态构建 |
params.ts |
运行参数配置 |
compact.ts |
会话压缩,防止上下文溢出 |
tool-split.ts |
工具集拆分策略 |
tool-result-truncation.ts |
工具返回结果的截断处理 |
lanes.ts |
执行队列通道管理 |
history.ts |
对话历史管理 |
payloads.ts |
请求载荷构建 |
核心机制解读:
会话压缩(Compact)
当对话历史过长即将超出模型上下文窗口时,compact.ts 会自动触发:
工具拆分策略(Tool Split)
当可用工具数量过多时,tool-split.ts 会根据当前任务上下文智能筛选工具子集,避免 Token 浪费:
全部工具集 (50+ tools)
↓ 工具策略引擎过滤
当前任务相关工具 (5-10 tools)
↓ 注入 LLM Prompt
模型只看到精简工具集
3.3 Skills 技能系统:模块化能力扩展
Skills 是 OpenClaw 的 “技能树”,采用四层优先级架构:
每个 Skill 的组成结构:
系统内置 Skills 示例:
| Skill 名称 | 功能 |
|---|---|
healthcheck |
系统健康检查 |
mcporter |
MCP 工具管理与桥接 |
weather |
天气查询 |
video-frames |
视频帧提取与分析 |
browser |
浏览器自动化操作 |
file-manager |
文件系统操作 |
shell |
Shell 命令执行 |
3.4 Nodes 远程节点:分布式能力扩展
Nodes 机制让 OpenClaw 的能力不局限于运行 Gateway 的那台机器。任何设备都可以作为节点接入,并声明自己的能力。
节点工作原理:
- 能力声明:每个节点连接后会声明自己的能力(如
shell、camera、browser) - 动态路由:Gateway 维护全局能力路由表,知道"哪个能力在哪台设备上"
- 智能分发:当 Agent 需要调用某个工具时,Gateway 自动将请求路由到拥有该能力的节点
- 安全通信:优先本地通信,外网通过 Tailscale 建立私有隧道
3.5 Memory 持久记忆:越用越懂你
OpenClaw 的记忆系统不同于普通的对话历史,它实现了 跨会话持久化。
记忆的类型:
- 用户偏好:“用户习惯用中文交流”、“用户偏好 Dark Mode”
- 事实记忆:“用户的邮箱是 xxx@gmail.com”、“用户在 A 公司工作”
- 任务模式:“用户每周一需要整理邮件”、“用户喜欢把 PDF 按日期归档”
四、安全架构:Docker 沙箱与工具策略
安全是 OpenClaw 架构设计中最关键的一环。
工具策略配置示例
channels:
telegram:
groups:
"-100123456": # 公开群
tools:
profile: "minimal" # 最小权限:只读,禁止 Shell/File Write
allow: ["web_search"]
toolsBySender:
"admin_user":
profile: "full" # 管理员拥有全权限
"-100987654": # 内部开发群
tools:
profile: "coding" # 允许代码执行
策略解析流程
五、技术栈全景图
六、与传统 AI 助手的架构对比
| 维度 | 传统 AI 助手 | OpenClaw |
|---|---|---|
| 运行位置 | 云端 | 本地设备 |
| 交互模式 | 请求-响应 | Agent Loop 事件循环 |
| 执行能力 | 仅生成文本 | 系统级操作(文件/Shell/浏览器) |
| 数据归属 | 服务商 | 用户自己 |
| 扩展机制 | 插件市场(受控) | Skills 四层开放架构 |
| 多端接入 | 专用客户端 | 任意通讯工具 |
| 设备协同 | 无 | Nodes 分布式节点 |
七、架构设计哲学总结
OpenClaw 的架构设计揭示了一个关键趋势:下一代 AI 产品的核心竞争力不在模型本身,而在于将模型的推理能力转化为现实世界执行力的"中间件"架构。Gateway、Agent Loop、Skills、Nodes——这四大组件共同构成了从"AI 能想"到"AI 能做"的桥梁。
这也正是 Peter Steinberger 所说的"80% App 将消失"的技术基础——当一个运行在本地的 AI 智能体能够直接操控你的整个数字世界时,那些充当"人机翻译层"的 App,自然就失去了存在的必要。
参考资料:OpenClaw 官方文档、GitHub 源码、社区技术解析文章
更多推荐

所有评论(0)