OpenClaw 是一款本地优先、可自托管、强执行能力的开源 AI Agent 执行引擎,核心是让 AI 从 “聊天” 落地为 “能干活的数字员工”。以下从产品定位、技术架构、开发历程三方面完整说明。

官网地址:https://openclaw.ai/

开源项目地址:https://github.com/openclaw/openclaw


一、产品说明

1. 核心定位

  • 本地优先:所有数据与执行在用户自有设备 / 服务器完成,不经过第三方中转,数据完全自主可控。
  • 强执行能力:不是被动问答,而是主动完成邮件处理、日程管理、代码编写、浏览器自动化、定时任务、数据看板生成等全流程事务。
  • 多渠道交互:通过统一网关接入 WhatsApp、Telegram、Discord、Slack、WebChat 等 15+ 平台。
  • 高可扩展:基于插件化(Skills)与 MCP 节点系统,支持自定义能力与分布式执行。

2. 核心能力

  • AI 编排:基于 PiAgent 运行时,实现 ReAct 式思考与工具调用。
  • 本地操作:文件读写、Shell 命令、浏览器控制、API 调用、代码编译与运行。
  • 记忆系统:持久化记忆(Soul.md/IDENTITY.md)、上下文管理、跨会话复用。
  • 任务调度:Lane-Based 队列系统,默认串行、显式并行,避免竞态。
  • 安全沙箱:执行层默认 Docker 隔离,保障本地系统安全。

3. 应用场景

  • 个人:邮件 / 日历管理、信息汇总、自动化办公、代码助手。
  • 企业:内网数据处理、流程自动化、多平台消息统一处理、安全可控的 AI 助手。
  • 开发者:API 集成、测试自动化、DevOps 辅助、自定义 Agent 开发。

二、技术架构

OpenClaw 采用微核 + 插件 + 统一网关的分层架构,核心是单 Gateway 控制平面,所有消息与任务经其统一调度。

1. 整体三层架构

plaintext

┌─────────────────────────────────────────────┐
│               用户交互层(Channels)         │
│ WhatsApp、Telegram、Slack、WebChat、CLI...  │
└───────────────────┬─────────────────────────┘
                    │
┌───────────────────▼─────────────────────────┐
│               网关协调层(Gateway)         │
│ WebSocket (ws://127.0.0.1:18789)            │
│ 消息路由、鉴权、会话管理、配置、监控         │
└───────────────────┬─────────────────────────┘
                    │
┌───────────────────▼─────────────────────────┐
│               执行能力层(Runtime)         │
│ PiAgent 运行时 + Skills + 沙箱 + 队列       │
│ 文件/浏览器/Shell/API/代码/定时任务...      │
└─────────────────────────────────────────────┘

2. 核心组件详解

(1)Gateway(控制中枢)
  • 角色:系统 “单一真相源” 与协调器,不处理 AI 逻辑,专注连接与调度。
  • 核心职责
    • WebSocket 服务(默认 127.0.0.1:18789),仅本机访问。
    • 消息路由、会话管理、权限验证、事件分发。
    • 插件(Skills/Channels)生命周期管理、热重载。
    • 配置与状态持久化、健康监控。
  • 设计优势:集中鉴权、单点审计、简化多通道状态同步。
(2)Channels(渠道适配器)
  • 负责与外部平台 API 交互,将各平台消息转为统一格式送入 Gateway。
  • 支持:WhatsApp、Telegram、Discord、Slack、Google Chat、Signal、iMessage、Microsoft Teams、WebChat 等。
  • 每个渠道独立适配器,可插拔、可扩展。
(3)PiAgent Runtime(智能核心)
  • 基于 @mariozechner/pi-agent-core 开源包,处理 AI 对话逻辑。
  • 核心能力:
    • ReAct 推理:思考 → 工具调用 → 结果整合 → 反馈。
    • 动态提示工程、多模型调度、上下文窗口管理。
    • 工具调用标准化:所有 Skills 遵循统一输入输出格式。
(4)Skills(技能插件)
  • 系统的 “能力单元”,如文件操作、浏览器控制、邮件发送、代码执行等。
  • 加载优先级:工作区技能 > 本地管理技能 > 内置技能。
  • 特性:热重载(修改即生效,无需重启)、标准化接口、沙箱执行。
(5)Lane-Based 队列系统
  • 任务调度核心,遵循 “默认串行,显式并行”。
  • 每个对话 / 任务独占一个 “车道”,避免状态冲突与日志混乱。
  • 低风险任务可显式并行,提升效率。
(6)记忆与上下文系统
  • 持久化记忆Soul.md/IDENTITY.md 存储用户偏好、人格设定,可手动编辑。
  • 分层记忆:短期会话上下文、中期任务记忆、长期用户画像。
  • 本地优先:所有记忆存储在本地,不上传云端。
(7)安全沙箱
  • 执行层默认运行在 Docker 容器中,隔离本地系统与 AI 操作。
  • 权限最小化:仅开放必要的文件 / 网络 / 系统权限。

三、开发历程

1. 项目起源

  • 由 PSPDFKit 创始人 Peter Steinberger 主导开发。
  • 核心代码约 17 万行 TypeScript,采用 MIT 开源协议
  • 2026 年 1 月 30 日正式定名 OpenClaw,此前历经两次更名:
    • 2025.11–2026.1:Clawdbot(龙虾吉祥物灵感)。
    • 2026.1.27–2026.1.30:Moltbot(龙虾脱壳生长寓意迭代)。

2. 开发理念

  • 本地优先:数据安全与隐私第一,拒绝云端依赖。
  • 解耦与模块化:Gateway、Channels、Runtime、Skills 完全分离,独立演进。
  • 工程化:强类型(TypeScript)、队列系统、沙箱、热重载,保障稳定性与可维护性。
  • 开源生态:鼓励社区贡献 Skills、Channels、扩展模块,2026 年 2 月举办首届社区大会 ClawCon。

3. 技术选型

  • 语言:TypeScript(强类型、工程化、全栈一致)。
  • 通信:WebSocket(Gateway 核心)、各平台官方 SDK/API(Channels)。
  • AI 层:PiAgent(ReAct 推理)、支持接入 GPT-4、Claude、本地模型等。
  • 执行:Node.js 运行时、Docker 沙箱、Puppeteer(浏览器自动化)、Shell 命令执行。
  • 存储:本地文件系统(记忆 / 配置)、无第三方数据库依赖。

4. 开发流程(简化)

  1. 需求与设计:明确本地优先、强执行、多渠道核心目标,设计微核 + 网关 + 插件架构。
  2. 核心模块开发
    • Gateway:WebSocket 服务、路由、会话、配置管理。
    • Channels:主流平台适配器开发与测试。
    • PiAgent:集成 ReAct 推理、工具调用、上下文管理。
    • Skills:内置核心技能(文件、浏览器、Shell、邮件等)开发。
  3. 工程化优化:Lane 队列、热重载、沙箱、日志、监控。
  4. 开源与社区:GitHub 发布、文档编写、社区贡献引导、版本迭代。

四、总结

OpenClaw 是 AI Agent 领域的工程化标杆,以本地优先、强执行、高扩展为核心,通过单 Gateway 控制平面 + 分层模块化架构,将大模型能力安全、可靠地落地到本地设备。它不仅是个人助手,更是一套完整的 AI 执行基础设施,适合个人、企业与开发者构建自主可控的自动化系统。

Logo

小龙虾开发者社区是 CSDN 旗下专注 OpenClaw 生态的官方阵地,聚焦技能开发、插件实践与部署教程,为开发者提供可直接落地的方案、工具与交流平台,助力高效构建与落地 AI 应用

更多推荐