OpenClaw 替代品？Hermes Agent 踩坑实录

小白的硅基观察

1077人浏览 · 2026-04-15 21:54:24

小白的硅基观察 · 2026-04-15 21:54:24 发布

工具链： Hermes Agent (v0.8.x) + 飞书 Bot (WebSocket) + macOS local 部署 + OpenAI GPT-5.4
GitHub： NousResearch/hermes-agent
官方文档： hermes-agent.nousresearch.com

本文记录 Hermes Agent 在 macOS 上的完整安装过程、飞书 bot 接入配置，以及三个核心场景（定时任务、即时新闻整理、跨平台记忆）的实测结果，并与 OpenClaw 进行体验对比。

最近满屏都是 OpenClaw vs Hermes Agent 的讨论，看了一圈，觉得光看别人吵没意思。

正好上周公司发了个通告：所有人把 Mac 上装的 OpenClaw 卸掉，安全团队说有隐患。再加上我之前用 OpenClaw 就被各种折腾搞得半死不活，这下彻底没理由留着了。

干脆趁这个机会，装一个 Hermes 试试。一个下午，Mac 上装好，接上飞书，测了三个场景。下面是完整的踩坑记录。

Hermes 是什么

简单说：一个开源 AI Agent，核心卖点是"越用越聪明"。

吸引我的是三个能力：跨会话记忆（聊过的事它会记住）、自动技能创建（完成任务后自动总结成可复用技能）、定时任务（自然语言设 cron）。支持飞书、Telegram、Discord 等 15 个以上消息平台。Nous Research 出品，MIT 开源，今年 2 月上线，GitHub 涨星极快。

它和 OpenClaw 什么关系？说清楚：不是继任者，是竞品。 设计哲学完全不同——
在这里插入图片描述

一句话：OpenClaw 让你搭积木，Hermes 给你一把瑞士军刀。后面三个场景会反复验证这个差距。

安装：和 OpenClaw 一样简单

安装体验上，Hermes 和 OpenClaw 差不多——都是一行命令搞定，然后 CLI 一步步引导你配置。这部分两者打平。

curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash

安装器自动搞定 Python、Node.js、ripgrep、ffmpeg，唯一前置条件是 Git。

但有个地方差点把我劝退。

browser tools 安装巨慢。 到 Installing Node.js dependencies (browser tools)... 这一步，终端就不动了。我盯着屏幕等了好几分钟，差点 Ctrl+C。后来才知道它在下载 Playwright 的浏览器二进制文件，几百 MB。如果你也卡在这里，等就是了。
在这里插入图片描述

然后出现了一个我完全没预料到的事。

我之前装过 Codex CLI，Hermes 安装时自动检测到了本机 ~/.codex/auth.json 里的 OAuth token，直接复用了。全程没问我 API key，也没让我配 OpenAI OAuth——选完 provider 之后直接就能用，打开就是 GPT-5.4。
在这里插入图片描述

这种"你不需要操心，我自己搞定"的体验，在开源工具里很少见。如果你没装过 Codex CLI，这一步需要手动跑 hermes model 选 LLM 提供商。

接飞书

飞书 bot 是整个安装过程中最容易卡住的环节。

先说我的情况：我用的是之前给 OpenClaw 创建的飞书 bot 应用，消息收发等权限已经开好了。如果你要从零创建，需要在飞书开放平台配置权限（im:message、im:resource、bot 等），具体步骤看 Hermes 官方飞书文档。

跑 hermes gateway setup，选飞书，填 App ID 和 App Secret。

这里踩了个坑。我用的 Ghostty 终端有个 Secure Keyboard Entry 功能，检测到密码输入框会自动拦截粘贴。结果 App Secret 我粘了三次都是空的，反复报 “Could not verify bot connection”，折腾了十来分钟才反应过来——临时关掉 Ghostty 的安全键盘功能就好了。用其他终端的不会遇到这个问题。
在这里插入图片描述
另外，实测下来一个好消息：不需要 ngrok。 网上很多教程说飞书 bot 要配公网地址，其实 Hermes 默认用 WebSocket 模式，主动连飞书服务器，笔记本上跑就行。

配好之后给 bot 发消息，它说"我不认识你"：
在这里插入图片描述
跑一行配对命令让它"认识"你就好：

hermes pairing approve feishu <配对码>

配对完成，再在飞书里发 /sethome 设置主频道——这一步是告诉 Hermes 把定时任务和通知都发到这个聊天窗口里。

装好之后的第一印象

正式测场景之前，我先随手试了两个事，结果都让我挺意外。

第一个：问天气。 我在飞书发了句"上海今天的天气？"，Hermes 直接调用了内置的 browser 工具，打开 wttr.in 抓了天气数据回来。整个过程全自动，不需要配任何 Search API。
在这里插入图片描述
这跟 OpenClaw 体验完全不一样。OpenClaw 联网搜索需要你自己配 Search API key，不配就用不了。Hermes 内置了浏览器工具（Playwright），自己打开网页抓数据。这一点是两者设计哲学差异最直观的体现——一个让你编排工具链，一个自己想办法。

第二个：语音消息。 直接发了条语音给 bot，它立刻识别转文字并理解了内容。零配置。OpenClaw 还得自己装语音相关的 plugin 才能处理语音消息。
![[voice-message-test.png]]
还没正式开测，已经感觉到 Hermes 在开箱体验上和 OpenClaw 拉开了差距。

三个场景

接下来是正式测试。三个场景，分别对应 Hermes 的三个核心能力。

定时推送

在飞书里发：

今天 17:30 推送 3 条今天最重要的 AI Agent 相关新闻，每条包含：标题、一句话总结、来源链接

Hermes 秒回，调用了 cronjob: "create"，返回任务 ID，说"已安排好"。看起来一切正常。
在这里插入图片描述
然后我就去忙别的了。

17:30 到了。没消息。18:00。还是没消息。我回去问它：“列出你现在所有的 cron job。” 它说：“当前没有任何 cron job。”

之前创建的任务凭空消失了。

定时任务是 Hermes 官方主打的功能之一，但我的首次测试——完全没跑通。

有一点值得说明：我在等 17:30 的过程中同时在测第二个场景（即时新闻整理），Hermes 在完成那个任务后自作主张又创建了一个类似的 cron job。不排除是两者之间产生了某种冲突。但不管原因是什么，"创建成功但没执行，事后还查不到"这个体验是实实在在的坑。

即时新闻整理

同样的需求，换成手动触发：

帮我整理今天 AI 领域的 3 条重要新闻，每条用一句话总结，标注来源

这次就很顺利了。Hermes 先调用了内置的 blogwatcher 技能，然后用浏览器跑 Google、Bing 搜索，还用 Python 脚本抓了 Reuters 的内容。
在这里插入图片描述
最终返回 3 条新闻，来源链接点进去真实可访问。

中间有个细节我觉得设计得很好：Python 脚本要访问 reuters.com 时，安全扫描拦截了，直接在飞书聊天窗里弹出审批卡片——Allow Once / Session / Always / Deny，四个按钮。点一下就放行。
在这里插入图片描述
用过 OpenClaw 的应该知道，之前这种权限控制得改配置文件，或者去 Web UI 后台审批。Hermes 直接把审批按钮放进了飞书聊天窗，不用切换界面，体验好太多了。

跨平台记忆

这个场景我最好奇。"越用越聪明"是不是真的？

我设计了一个测试：在 CLI 端定义一个总结模板，然后切到飞书看它还记不记得。

CLI 端：

以后帮我总结文章的时候，用这个格式：先写一句话总结，再列 3 个关键要点，最后给一个评分（1-5 分）

Hermes 说"记住了"。我看到它调用了 memory +user，把偏好存了下来。
在这里插入图片描述
切到飞书，发了一篇 Reddit 帖子让它总结。

结果——模板生效了。一句话总结、关键要点、评分，格式完全对。CLI 里说的话，飞书里也记得。
在这里插入图片描述
更有意思的是，完成总结后，Hermes 自动创建了一个 Skill 叫 reddit-post-fallback-summary。意思是下次再让它总结 Reddit 帖子，它会直接调用这个技能。真的在"学习"。

但也有点过度热情——任务结束后它自作主张又创建了一个 cron job，没人让它这么干。有时候聪明和自作主张只有一线之隔。
在这里插入图片描述

一个下午的真实感受

先放一张对比表，再说感受：

能力	OpenClaw	Hermes
安装	一行命令 + CLI 引导	一行命令 + CLI 引导（持平）
联网搜索	需要自己配 Search API	内置浏览器，开箱即用
语音消息	需要装 STT 插件	开箱即用
认证	手动配 API key	自动检测 Codex CLI token
权限审批	改配置文件 / Web UI	飞书聊天内按钮
定时任务	能用（但费 token）	创建成功但没执行
跨平台记忆	无	CLI ↔ 飞书记忆互通
自动技能	无	完成任务后自动创建