一、四个组件核心定义(一句话区分)

1. Channel(消息渠道 / 交互入口)—— 耳朵 & 嘴巴

定位:用户和系统的所有交互入口,接入层openclawla...

  • 作用:对接各类聊天软件、控制台、网页、API,把外部不同格式消息统一翻译成系统标准事件;Agent 回复时再转成对应平台格式发回去
  • 常见类型:Web 控制台、CLI 终端、Telegram、钉钉 / 飞书、Discord、HTTP Webhook、手机 App 客户端
  • 特点:可插拔、多渠道同时在线;只负责收发消息与通信,不做思考、不执行任务

2. Gateway(网关 / 控制平面)—— 中枢神经、总调度中心

定位:全局唯一常驻后台进程,中间调度层,核心枢纽

默认端口 18789,整个 OpenClaw 只运行一个 Gateway 实例 核心职责:

  1. 统一管理所有 Channel 连接、鉴权、安全校验;
  2. 消息路由:把 Channel 收到的用户消息分发到对应 Agent 会话;
  3. 全局会话、记忆、技能、多 Agent 状态统一管理;
  4. 向上提供 WebSocket/HTTP API,向下驱动 Agent Runtime、加载所有 Skill;
  5. 广播事件、管控任务并发、日志聚合、远程节点配对。 类比:公司总机 + 调度室,所有渠道、AI 大脑、工具都要连它,没有 Gateway 整个系统无法通信。

3. Agent(智能体 / 推理大脑)—— 思考决策者

定位:AI 推理执行单元,业务逻辑层

  • 本质:带独立人设(SOUL.md)、对话记忆、ReAct 推理循环的 LLM 运行实例
  • 核心流程:接收 Gateway 转发的用户消息 → 读取人设 + 历史对话 → 判断任务意图 → 决定调用哪些 Skill → 执行工具后整合结果生成回复
  • 支持多 Agent:主 Agent (main)、子 Agent (sub-agent),分工隔离(写代码 Agent、办公文档 Agent 互不干扰)
  • 权限:由 Gateway 管控能使用哪些 Skill、可访问哪些文件 / 系统命令

4. Skill(技能 / 工具箱)—— 动手执行工具集

定位:可被 Agent 调用的标准化能力包,执行层

  • 每个 Skill 是独立插件(SKILL.md定义),包含:功能描述、入参、权限、底层执行逻辑(Shell、浏览器、文件读写、第三方 API、爬虫等)
  • 作用:Agent 只有思考能力,无法操作电脑、联网、读写文件,必须通过 Skill 完成真实动作
  • 加载规则:Gateway 统一扫描全局 / 工作区所有 Skill,再按需注入给对应 Agent;支持权限黑白名单、沙箱隔离

二、四层自上而下层级关系(数据流链路)

plaintext

用户 → Channel(多入口)
        ↓ 消息标准化、上传
    Gateway(单例中枢,路由+鉴权)
        ↓ 分发会话任务
    Agent(大脑推理,判断要干什么)
        ↓ 按需调用
    Skill(工具,真实执行操作)
        ↓ 执行结果回传
    Agent 整合输出
        ↓ 回复消息推送
    Gateway
        ↓ 分发给对应Channel
用户收到回答

三、四组件对比表

表格

组件 层级 核心角色 能否多实例 核心产出 典型配置文件
Channel 最上层接入层 交互入口,收发消息 无限多个(Web、TG、CLI 同时在线) 标准化用户事件 channel 配置 yaml
Gateway 全局控制层 统一调度、路由、鉴权 全局仅 1 个守护进程 会话路由、权限管控 gateway config
Agent 推理执行层 AI 思考、任务规划 多个(main / 子 Agent) 推理结论、工具调用指令 SOUL.md、AGENTS.md
Skill 底层能力层 系统操作、外部调用 数十个可按需启用 文件 / 命令 / 网络执行结果 SKILL.md

四、通俗生活化类比(快速记忆)

把 OpenClaw 比作一家独立工作室:

  1. Channel = 对外客服窗口:电话 (Telegram)、网页 (Web UI)、线下柜台 (CLI),客户在这里说话;
  2. Gateway = 前台总管:所有窗口消息汇总,核对身份、分配工单给对应专员,管控所有工具权限;
  3. Agent = 专职专员(大脑):有专属专业方向,看懂客户需求,想好要做哪些操作;
  4. Skill = 工作室工具(打印机 / 电脑 / 浏览器 / 终端):专员自己不能打印、上网,必须用工具完成操作。

五、关键关联规则(实操必懂)

  1. Gateway 是唯一桥梁 Channel、Agent、Skill 三者不能直接通信,所有数据流转必须经过 Gateway;关闭 Gateway,所有渠道全部断连、Agent 停止响应。
  2. Agent 与 Skill 是调用关系 Skill 被动等待 Agent 调用;Agent 不会自动执行操作,只有判断任务需要才会请求 Gateway 加载对应 Skill 执行。
  3. Channel 和 Agent 是多对多映射
    • 一个 Channel 可绑定多个 Agent(群聊区分不同指令交给不同子 Agent);
    • 一个 Agent 可接收多个 Channel 消息(电脑网页、手机 TG 共用同一个主 Agent)。
  4. Skill 全局注册、Agent 按需授权 Gateway 加载全部 Skill,但每个 Agent 有独立权限配置:可以限制某 Agent 不能执行高危 Shell Skill。

六、完整消息流转示例(发指令:帮我统计桌面文件)

  1. 用户在 Telegram Channel 发送消息:统计桌面文件;
  2. Telegram Channel 插件把消息转为系统标准事件,上传 Gateway;
  3. Gateway 校验账号权限,匹配当前会话绑定的 main Agent,下发任务;
  4. main Agent 读取人设与对话,推理得出:需要调用「文件遍历 Skill」;
  5. Agent 向 Gateway 发起 Skill 调用请求,Gateway 校验该 Agent 允许使用文件 Skill;
  6. Gateway 加载文件 Skill,执行读取桌面目录操作,把文件列表返回 Agent;
  7. Agent 整理文字结果,生成自然语言回复推送至 Gateway;
  8. Gateway 识别消息来源是 Telegram 渠道,转发对应 Channel;
  9. Telegram Channel 把标准回复转成聊天消息发给用户。

Logo

小龙虾开发者社区是 CSDN 旗下专注 OpenClaw 生态的官方阵地,聚焦技能开发、插件实践与部署教程,为开发者提供可直接落地的方案、工具与交流平台,助力高效构建与落地 AI 应用

更多推荐