OpenClaw产品说明、技术架构及开发历程

OpenClaw 是 AI Agent 领域的工程化标杆，以本地优先、强执行、高扩展为核心，通过单 Gateway 控制平面 + 分层模块化架构，将大模型能力安全、可靠地落地到本地设备。它不仅是个人助手，更是一套完整的 AI 执行基础设施，适合个人、企业与开发者构建自主可控的自动化系统。

2401_83450572

1897人浏览 · 2026-03-02 16:34:06

2401_83450572 · 2026-03-02 16:34:06 发布

OpenClaw 是一款本地优先、可自托管、强执行能力的开源 AI Agent 执行引擎，核心是让 AI 从 “聊天” 落地为 “能干活的数字员工”。以下从产品定位、技术架构、开发历程三方面完整说明。

官网地址：https://openclaw.ai/

开源项目地址：https://github.com/openclaw/openclaw

一、产品说明

1. 核心定位

本地优先：所有数据与执行在用户自有设备 / 服务器完成，不经过第三方中转，数据完全自主可控。
强执行能力：不是被动问答，而是主动完成邮件处理、日程管理、代码编写、浏览器自动化、定时任务、数据看板生成等全流程事务。
多渠道交互：通过统一网关接入 WhatsApp、Telegram、Discord、Slack、WebChat 等 15+ 平台。
高可扩展：基于插件化（Skills）与 MCP 节点系统，支持自定义能力与分布式执行。

2. 核心能力

AI 编排：基于 PiAgent 运行时，实现 ReAct 式思考与工具调用。
本地操作：文件读写、Shell 命令、浏览器控制、API 调用、代码编译与运行。
记忆系统：持久化记忆（Soul.md/IDENTITY.md）、上下文管理、跨会话复用。
任务调度：Lane-Based 队列系统，默认串行、显式并行，避免竞态。
安全沙箱：执行层默认 Docker 隔离，保障本地系统安全。

3. 应用场景

个人：邮件 / 日历管理、信息汇总、自动化办公、代码助手。
企业：内网数据处理、流程自动化、多平台消息统一处理、安全可控的 AI 助手。
开发者：API 集成、测试自动化、DevOps 辅助、自定义 Agent 开发。

二、技术架构

OpenClaw 采用微核 + 插件 + 统一网关的分层架构，核心是单 Gateway 控制平面，所有消息与任务经其统一调度。

1. 整体三层架构

plaintext

┌─────────────────────────────────────────────┐
│               用户交互层（Channels）         │
│ WhatsApp、Telegram、Slack、WebChat、CLI...  │
└───────────────────┬─────────────────────────┘
                    │
┌───────────────────▼─────────────────────────┐
│               网关协调层（Gateway）         │
│ WebSocket (ws://127.0.0.1:18789)            │
│ 消息路由、鉴权、会话管理、配置、监控         │
└───────────────────┬─────────────────────────┘
                    │
┌───────────────────▼─────────────────────────┐
│               执行能力层（Runtime）         │
│ PiAgent 运行时 + Skills + 沙箱 + 队列       │
│ 文件/浏览器/Shell/API/代码/定时任务...      │
└─────────────────────────────────────────────┘

2. 核心组件详解

（1）Gateway（控制中枢）

角色：系统 “单一真相源” 与协调器，不处理 AI 逻辑，专注连接与调度。
核心职责：
- WebSocket 服务（默认 127.0.0.1:18789），仅本机访问。
- 消息路由、会话管理、权限验证、事件分发。
- 插件（Skills/Channels）生命周期管理、热重载。
- 配置与状态持久化、健康监控。
设计优势：集中鉴权、单点审计、简化多通道状态同步。

（2）Channels（渠道适配器）

负责与外部平台 API 交互，将各平台消息转为统一格式送入 Gateway。
支持：WhatsApp、Telegram、Discord、Slack、Google Chat、Signal、iMessage、Microsoft Teams、WebChat 等。
每个渠道独立适配器，可插拔、可扩展。

（3）PiAgent Runtime（智能核心）

基于 @mariozechner/pi-agent-core 开源包，处理 AI 对话逻辑。
核心能力：
- ReAct 推理：思考 → 工具调用 → 结果整合 → 反馈。
- 动态提示工程、多模型调度、上下文窗口管理。
- 工具调用标准化：所有 Skills 遵循统一输入输出格式。

（4）Skills（技能插件）

系统的 “能力单元”，如文件操作、浏览器控制、邮件发送、代码执行等。
加载优先级：工作区技能 > 本地管理技能 > 内置技能。
特性：热重载（修改即生效，无需重启）、标准化接口、沙箱执行。

（5）Lane-Based 队列系统

任务调度核心，遵循 “默认串行，显式并行”。
每个对话 / 任务独占一个 “车道”，避免状态冲突与日志混乱。
低风险任务可显式并行，提升效率。

（6）记忆与上下文系统

持久化记忆：Soul.md/IDENTITY.md 存储用户偏好、人格设定，可手动编辑。
分层记忆：短期会话上下文、中期任务记忆、长期用户画像。
本地优先：所有记忆存储在本地，不上传云端。

（7）安全沙箱

执行层默认运行在 Docker 容器中，隔离本地系统与 AI 操作。
权限最小化：仅开放必要的文件 / 网络 / 系统权限。

三、开发历程

1. 项目起源

由 PSPDFKit 创始人 Peter Steinberger 主导开发。
核心代码约 17 万行 TypeScript，采用 MIT 开源协议。
2026 年 1 月 30 日正式定名 OpenClaw，此前历经两次更名：
- 2025.11–2026.1：Clawdbot（龙虾吉祥物灵感）。
- 2026.1.27–2026.1.30：Moltbot（龙虾脱壳生长寓意迭代）。

2. 开发理念

本地优先：数据安全与隐私第一，拒绝云端依赖。
解耦与模块化：Gateway、Channels、Runtime、Skills 完全分离，独立演进。
工程化：强类型（TypeScript）、队列系统、沙箱、热重载，保障稳定性与可维护性。
开源生态：鼓励社区贡献 Skills、Channels、扩展模块，2026 年 2 月举办首届社区大会 ClawCon。

3. 技术选型

语言：TypeScript（强类型、工程化、全栈一致）。
通信：WebSocket（Gateway 核心）、各平台官方 SDK/API（Channels）。
AI 层：PiAgent（ReAct 推理）、支持接入 GPT-4、Claude、本地模型等。
执行：Node.js 运行时、Docker 沙箱、Puppeteer（浏览器自动化）、Shell 命令执行。
存储：本地文件系统（记忆 / 配置）、无第三方数据库依赖。

4. 开发流程（简化）

需求与设计：明确本地优先、强执行、多渠道核心目标，设计微核 + 网关 + 插件架构。
核心模块开发：
- Gateway：WebSocket 服务、路由、会话、配置管理。
- Channels：主流平台适配器开发与测试。
- PiAgent：集成 ReAct 推理、工具调用、上下文管理。
- Skills：内置核心技能（文件、浏览器、Shell、邮件等）开发。
工程化优化：Lane 队列、热重载、沙箱、日志、监控。
开源与社区：GitHub 发布、文档编写、社区贡献引导、版本迭代。

四、总结

OpenClaw 是 AI Agent 领域的工程化标杆，以本地优先、强执行、高扩展为核心，通过单 Gateway 控制平面 + 分层模块化架构，将大模型能力安全、可靠地落地到本地设备。它不仅是个人助手，更是一套完整的 AI 执行基础设施，适合个人、企业与开发者构建自主可控的自动化系统。