OpenClaw产品说明、技术架构及开发历程
OpenClaw 是 AI Agent 领域的工程化标杆,以本地优先、强执行、高扩展为核心,通过单 Gateway 控制平面 + 分层模块化架构,将大模型能力安全、可靠地落地到本地设备。它不仅是个人助手,更是一套完整的 AI 执行基础设施,适合个人、企业与开发者构建自主可控的自动化系统。
·
OpenClaw 是一款本地优先、可自托管、强执行能力的开源 AI Agent 执行引擎,核心是让 AI 从 “聊天” 落地为 “能干活的数字员工”。以下从产品定位、技术架构、开发历程三方面完整说明。
官网地址:https://openclaw.ai/
开源项目地址:https://github.com/openclaw/openclaw
一、产品说明
1. 核心定位
- 本地优先:所有数据与执行在用户自有设备 / 服务器完成,不经过第三方中转,数据完全自主可控。
- 强执行能力:不是被动问答,而是主动完成邮件处理、日程管理、代码编写、浏览器自动化、定时任务、数据看板生成等全流程事务。
- 多渠道交互:通过统一网关接入 WhatsApp、Telegram、Discord、Slack、WebChat 等 15+ 平台。
- 高可扩展:基于插件化(Skills)与 MCP 节点系统,支持自定义能力与分布式执行。
2. 核心能力
- AI 编排:基于 PiAgent 运行时,实现 ReAct 式思考与工具调用。
- 本地操作:文件读写、Shell 命令、浏览器控制、API 调用、代码编译与运行。
- 记忆系统:持久化记忆(Soul.md/IDENTITY.md)、上下文管理、跨会话复用。
- 任务调度:Lane-Based 队列系统,默认串行、显式并行,避免竞态。
- 安全沙箱:执行层默认 Docker 隔离,保障本地系统安全。
3. 应用场景
- 个人:邮件 / 日历管理、信息汇总、自动化办公、代码助手。
- 企业:内网数据处理、流程自动化、多平台消息统一处理、安全可控的 AI 助手。
- 开发者:API 集成、测试自动化、DevOps 辅助、自定义 Agent 开发。
二、技术架构
OpenClaw 采用微核 + 插件 + 统一网关的分层架构,核心是单 Gateway 控制平面,所有消息与任务经其统一调度。
1. 整体三层架构
plaintext
┌─────────────────────────────────────────────┐
│ 用户交互层(Channels) │
│ WhatsApp、Telegram、Slack、WebChat、CLI... │
└───────────────────┬─────────────────────────┘
│
┌───────────────────▼─────────────────────────┐
│ 网关协调层(Gateway) │
│ WebSocket (ws://127.0.0.1:18789) │
│ 消息路由、鉴权、会话管理、配置、监控 │
└───────────────────┬─────────────────────────┘
│
┌───────────────────▼─────────────────────────┐
│ 执行能力层(Runtime) │
│ PiAgent 运行时 + Skills + 沙箱 + 队列 │
│ 文件/浏览器/Shell/API/代码/定时任务... │
└─────────────────────────────────────────────┘
2. 核心组件详解
(1)Gateway(控制中枢)
- 角色:系统 “单一真相源” 与协调器,不处理 AI 逻辑,专注连接与调度。
- 核心职责:
- WebSocket 服务(默认 127.0.0.1:18789),仅本机访问。
- 消息路由、会话管理、权限验证、事件分发。
- 插件(Skills/Channels)生命周期管理、热重载。
- 配置与状态持久化、健康监控。
- 设计优势:集中鉴权、单点审计、简化多通道状态同步。
(2)Channels(渠道适配器)
- 负责与外部平台 API 交互,将各平台消息转为统一格式送入 Gateway。
- 支持:WhatsApp、Telegram、Discord、Slack、Google Chat、Signal、iMessage、Microsoft Teams、WebChat 等。
- 每个渠道独立适配器,可插拔、可扩展。
(3)PiAgent Runtime(智能核心)
- 基于
@mariozechner/pi-agent-core开源包,处理 AI 对话逻辑。 - 核心能力:
- ReAct 推理:思考 → 工具调用 → 结果整合 → 反馈。
- 动态提示工程、多模型调度、上下文窗口管理。
- 工具调用标准化:所有 Skills 遵循统一输入输出格式。
(4)Skills(技能插件)
- 系统的 “能力单元”,如文件操作、浏览器控制、邮件发送、代码执行等。
- 加载优先级:工作区技能 > 本地管理技能 > 内置技能。
- 特性:热重载(修改即生效,无需重启)、标准化接口、沙箱执行。
(5)Lane-Based 队列系统
- 任务调度核心,遵循 “默认串行,显式并行”。
- 每个对话 / 任务独占一个 “车道”,避免状态冲突与日志混乱。
- 低风险任务可显式并行,提升效率。
(6)记忆与上下文系统
- 持久化记忆:
Soul.md/IDENTITY.md存储用户偏好、人格设定,可手动编辑。 - 分层记忆:短期会话上下文、中期任务记忆、长期用户画像。
- 本地优先:所有记忆存储在本地,不上传云端。
(7)安全沙箱
- 执行层默认运行在 Docker 容器中,隔离本地系统与 AI 操作。
- 权限最小化:仅开放必要的文件 / 网络 / 系统权限。
三、开发历程
1. 项目起源
- 由 PSPDFKit 创始人 Peter Steinberger 主导开发。
- 核心代码约 17 万行 TypeScript,采用 MIT 开源协议。
- 2026 年 1 月 30 日正式定名 OpenClaw,此前历经两次更名:
- 2025.11–2026.1:Clawdbot(龙虾吉祥物灵感)。
- 2026.1.27–2026.1.30:Moltbot(龙虾脱壳生长寓意迭代)。
2. 开发理念
- 本地优先:数据安全与隐私第一,拒绝云端依赖。
- 解耦与模块化:Gateway、Channels、Runtime、Skills 完全分离,独立演进。
- 工程化:强类型(TypeScript)、队列系统、沙箱、热重载,保障稳定性与可维护性。
- 开源生态:鼓励社区贡献 Skills、Channels、扩展模块,2026 年 2 月举办首届社区大会 ClawCon。
3. 技术选型
- 语言:TypeScript(强类型、工程化、全栈一致)。
- 通信:WebSocket(Gateway 核心)、各平台官方 SDK/API(Channels)。
- AI 层:PiAgent(ReAct 推理)、支持接入 GPT-4、Claude、本地模型等。
- 执行:Node.js 运行时、Docker 沙箱、Puppeteer(浏览器自动化)、Shell 命令执行。
- 存储:本地文件系统(记忆 / 配置)、无第三方数据库依赖。
4. 开发流程(简化)
- 需求与设计:明确本地优先、强执行、多渠道核心目标,设计微核 + 网关 + 插件架构。
- 核心模块开发:
- Gateway:WebSocket 服务、路由、会话、配置管理。
- Channels:主流平台适配器开发与测试。
- PiAgent:集成 ReAct 推理、工具调用、上下文管理。
- Skills:内置核心技能(文件、浏览器、Shell、邮件等)开发。
- 工程化优化:Lane 队列、热重载、沙箱、日志、监控。
- 开源与社区:GitHub 发布、文档编写、社区贡献引导、版本迭代。
四、总结
OpenClaw 是 AI Agent 领域的工程化标杆,以本地优先、强执行、高扩展为核心,通过单 Gateway 控制平面 + 分层模块化架构,将大模型能力安全、可靠地落地到本地设备。它不仅是个人助手,更是一套完整的 AI 执行基础设施,适合个人、企业与开发者构建自主可控的自动化系统。
更多推荐




所有评论(0)