MiniMax2.5+OpenClaw#拆解并复刻一个 AI 智能体网关 Gateway

真正的个人助理不应是一个网页窗口，而是一个运行在你掌控之下的网关。通过把“大脑（模型）”与“感官（节点）”解耦，我们才真正拥有了数字世界的自由。你既能跟柜员实时聊天（WS），也可以往柜台信箱里塞一个自动填表的申请单（HTTP Webhook）。如果你想从 0 到 1 复刻一个类似的个人 AI 助理系统，读懂网关的实现逻辑是第一步。包裹上贴了回执单，不管里面的东西是谁做的（AI 思考），包裹最后一定

shadowcz007

603人浏览 · 2026-02-15 11:47:37

shadowcz007 · 2026-02-15 11:47:37 发布

Shadow：MiniMax 近期发布 M2.5 模型，在多项指标上追平甚至超越 Gemini 3 Pro，同时推理速度更快。官方推出的 Code Plan 编程套餐仅需 119 元/月（1 分钟 1 Prompt），通过邀请链接还可享 9 折优惠 —— 搭配 OpenClaw 使用，堪称当前性价比最优的 AI 编程方案。

这几天我深度体验 OpenClaw，最大感受是权限开放度极高：几乎所有操作都能直接在 Dashboard 通过自然语言交互完成，例如查看 Skill 目录路径、调试工具链等。不过官方文档篇幅较长，完整掌握仍需投入时间。

龙虾OpenClaw交流群

目前我主要通过企业微信驱动 Agent 构建情报挖掘系统：基于自定义 Skill，结合 MiniMax M2.5 的推理能力，定时完成信息采集、清洗与分析闭环。

而支撑这一切的核心，正是 OpenClaw 的网关架构 —— 它如同数字世界的神经中枢，能将各类设备与系统无缝接入统一的 AI 协作网络。

拆解并复刻一个 AI 智能体网关（Gateway）

在 OpenClaw（原名 Maltbot/Clawdbot）的架构中，网关（Gateway） 既是中枢神经，也是整套系统的灵魂。如果你想从 0 到 1 复刻一个类似的个人 AI 助理系统，读懂网关的实现逻辑是第一步。

我们将网关拆解为 6 个核心维度，并附上可直接作为 Prompt 的技术指令。

维度 1：多路复用：一个窗口办所有事

实现逻辑： 网关在单一端口（默认 18789）上同时跑着两种通信协议：WebSocket 和 HTTP。

WebSocket： 负责“热线电话”，处理实时的指令收发、工具调用流和状态推送。
HTTP： 负责“信件快递”，提供控制面板（UI）、接收外部触发（Webhooks）和 API 兼容接口。

💡 小白例子： 想象网关是一个全能柜台。你既能跟柜员实时聊天（WS），也可以往柜台信箱里塞一个自动填表的申请单（HTTP Webhook）。

维度 2：协议解析：技术世界的“共同语言”

实现逻辑： 为了保证数据不错乱，网关使用 TypeBox 定义了一套严密的 JSON 架构。

所有的通信被分为三类帧：请求（Request）、响应（Response） 和 事件（Event）。
强制握手： 任何设备连接的第一帧必须是 connect，否则网关会直接关门（断开连接）。

💡 小白例子： 就像进电梯要按楼层。如果你进门不说话也不按楼层，电梯安全系统会觉得你很可疑，直接把你踢出去。

维度 3：身份分级：主人与仆从的逻辑

实现逻辑： 网关通过连接时的声明区分角色（Roles）：

Operator（操作员）： 主人或管理员，拥有修改配置、启动 Agent 的全权。
Node（执行节点）： 你的手机或另一台 Mac。它们像“器官”一样挂载到网关上，报告自己有“摄像头”、“屏幕”或“运行 Shell 指令”的能力。

💡 小白例子： 管家（网关）点名时，确认你是“发号施令的主人”，还是“负责拍照的保镖”。

维度 4：确定性路由：消息从哪来，回哪去

实现逻辑： 网关不让 AI 模型决定回复渠道。它会记录每条入站消息的 SessionKey（会话键）。

如果你从 WhatsApp 发消息，回复必然回到 WhatsApp；如果你在 Telegram 提问，它绝不会去 Discord 找你。

💡 小白例子： 就像送快递。包裹上贴了回执单，不管里面的东西是谁做的（AI 思考），包裹最后一定会退回到发件地址。

维度 5：安全保镖：权限与配对机制

实现逻辑： 既然网关能控制电脑，安全就是生命线。

设备配对（Pairing）： 新设备连接时，网关会弹出审批，必须主人手动批准并颁发“设备令牌”。
执行审批（Exec Approvals）： 当 AI 试图运行高风险命令（比如格式化硬盘）时，网关会向操作员推送询问框。

💡 小白例子： 就像你家指纹锁。第一次录入（配对）必须用备用钥匙（手动审批），之后指纹（令牌）才管用。

维度 6：自动化引擎：心跳与定时任务

实现逻辑： 网关不只是被动响应，它有“自愈”和“预警”能力。

Cron 任务： 用于死任务（比如每天 9 点发日报）。
Heartbeat（心跳）： 定期唤醒 AI 扫视你的数字资产（邮箱、日历），发现异样主动开口。

💡 小白例子： 就像保姆。每天 7 点准时叫你起床（Cron），并且每隔半小时巡视一圈厨房看火灭没灭（Heartbeat）。

🚀 智能体网关生成 Prompt

你可以将以下内容直接输入 ChatGPT/Claude，生成网关的初步代码框架：

Role: 资深分布式系统架构师。

Task: 基于 TypeScript 和 Node.js 生成一个 AI Agent 网关的核心框架代码。

Requirements:

多路复用： 使用 WebSocket (ws库) 和 HTTP (Express) 监听同一端口，支持 WebSocket 帧与 API 请求。
角色管理： 实现 connect 握手逻辑，支持 operator 和 node 两种角色。 node 连接时需声明能力（capabilities）。
会话路由： 建立 Map<sessionKey,connection> 映射，实现“确定性路由”逻辑，确保响应能原路返回。
安全层： 实现简易的设备配对机制，所有请求需携带 deviceId 和 deviceToken 验证。
任务调度： 预留 Heartbeat 接口，支持每隔 N 分钟自动触发一次特定的 AI Agent 处理逻辑。
存储模型： 将会话历史持久化为本地 JSONL 文件，记忆库以 Markdown 格式存储。