工具链: Hermes Agent (v0.8.x) + 飞书 Bot (WebSocket) + macOS local 部署 + OpenAI GPT-5.4
GitHub: NousResearch/hermes-agent
官方文档: hermes-agent.nousresearch.com

本文记录 Hermes Agent 在 macOS 上的完整安装过程、飞书 bot 接入配置,以及三个核心场景(定时任务、即时新闻整理、跨平台记忆)的实测结果,并与 OpenClaw 进行体验对比。


最近满屏都是 OpenClaw vs Hermes Agent 的讨论,看了一圈,觉得光看别人吵没意思。

正好上周公司发了个通告:所有人把 Mac 上装的 OpenClaw 卸掉,安全团队说有隐患。再加上我之前用 OpenClaw 就被各种折腾搞得半死不活,这下彻底没理由留着了。

干脆趁这个机会,装一个 Hermes 试试。一个下午,Mac 上装好,接上飞书,测了三个场景。下面是完整的踩坑记录。

Hermes 是什么

简单说:一个开源 AI Agent,核心卖点是"越用越聪明"。

吸引我的是三个能力:跨会话记忆(聊过的事它会记住)、自动技能创建(完成任务后自动总结成可复用技能)、定时任务(自然语言设 cron)。支持飞书、Telegram、Discord 等 15 个以上消息平台。Nous Research 出品,MIT 开源,今年 2 月上线,GitHub 涨星极快。

它和 OpenClaw 什么关系?说清楚:不是继任者,是竞品。 设计哲学完全不同——
在这里插入图片描述

一句话:OpenClaw 让你搭积木,Hermes 给你一把瑞士军刀。后面三个场景会反复验证这个差距。

安装:和 OpenClaw 一样简单

安装体验上,Hermes 和 OpenClaw 差不多——都是一行命令搞定,然后 CLI 一步步引导你配置。这部分两者打平。

curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash

安装器自动搞定 Python、Node.js、ripgrep、ffmpeg,唯一前置条件是 Git。

但有个地方差点把我劝退。

browser tools 安装巨慢。Installing Node.js dependencies (browser tools)... 这一步,终端就不动了。我盯着屏幕等了好几分钟,差点 Ctrl+C。后来才知道它在下载 Playwright 的浏览器二进制文件,几百 MB。如果你也卡在这里,等就是了。
在这里插入图片描述

然后出现了一个我完全没预料到的事。

我之前装过 Codex CLI,Hermes 安装时自动检测到了本机 ~/.codex/auth.json 里的 OAuth token,直接复用了。全程没问我 API key,也没让我配 OpenAI OAuth——选完 provider 之后直接就能用,打开就是 GPT-5.4。
在这里插入图片描述

这种"你不需要操心,我自己搞定"的体验,在开源工具里很少见。如果你没装过 Codex CLI,这一步需要手动跑 hermes model 选 LLM 提供商。

接飞书

飞书 bot 是整个安装过程中最容易卡住的环节。

先说我的情况:我用的是之前给 OpenClaw 创建的飞书 bot 应用,消息收发等权限已经开好了。如果你要从零创建,需要在飞书开放平台配置权限(im:messageim:resourcebot 等),具体步骤看 Hermes 官方飞书文档

hermes gateway setup,选飞书,填 App ID 和 App Secret。

这里踩了个坑。我用的 Ghostty 终端有个 Secure Keyboard Entry 功能,检测到密码输入框会自动拦截粘贴。结果 App Secret 我粘了三次都是空的,反复报 “Could not verify bot connection”,折腾了十来分钟才反应过来——临时关掉 Ghostty 的安全键盘功能就好了。用其他终端的不会遇到这个问题。
在这里插入图片描述
另外,实测下来一个好消息:不需要 ngrok。 网上很多教程说飞书 bot 要配公网地址,其实 Hermes 默认用 WebSocket 模式,主动连飞书服务器,笔记本上跑就行。

配好之后给 bot 发消息,它说"我不认识你":
在这里插入图片描述
跑一行配对命令让它"认识"你就好:

hermes pairing approve feishu <配对码>

配对完成,再在飞书里发 /sethome 设置主频道——这一步是告诉 Hermes 把定时任务和通知都发到这个聊天窗口里。

装好之后的第一印象

正式测场景之前,我先随手试了两个事,结果都让我挺意外。

第一个:问天气。 我在飞书发了句"上海今天的天气?",Hermes 直接调用了内置的 browser 工具,打开 wttr.in 抓了天气数据回来。整个过程全自动,不需要配任何 Search API。
在这里插入图片描述
这跟 OpenClaw 体验完全不一样。OpenClaw 联网搜索需要你自己配 Search API key,不配就用不了。Hermes 内置了浏览器工具(Playwright),自己打开网页抓数据。这一点是两者设计哲学差异最直观的体现——一个让你编排工具链,一个自己想办法。

第二个:语音消息。 直接发了条语音给 bot,它立刻识别转文字并理解了内容。零配置。OpenClaw 还得自己装语音相关的 plugin 才能处理语音消息。
![[voice-message-test.png]]
还没正式开测,已经感觉到 Hermes 在开箱体验上和 OpenClaw 拉开了差距。

三个场景

接下来是正式测试。三个场景,分别对应 Hermes 的三个核心能力。

定时推送

在飞书里发:

今天 17:30 推送 3 条今天最重要的 AI Agent 相关新闻,每条包含:标题、一句话总结、来源链接

Hermes 秒回,调用了 cronjob: "create",返回任务 ID,说"已安排好"。看起来一切正常。
在这里插入图片描述
然后我就去忙别的了。

17:30 到了。没消息。18:00。还是没消息。我回去问它:“列出你现在所有的 cron job。” 它说:“当前没有任何 cron job。”

之前创建的任务凭空消失了。

定时任务是 Hermes 官方主打的功能之一,但我的首次测试——完全没跑通。

有一点值得说明:我在等 17:30 的过程中同时在测第二个场景(即时新闻整理),Hermes 在完成那个任务后自作主张又创建了一个类似的 cron job。不排除是两者之间产生了某种冲突。但不管原因是什么,"创建成功但没执行,事后还查不到"这个体验是实实在在的坑。

即时新闻整理

同样的需求,换成手动触发:

帮我整理今天 AI 领域的 3 条重要新闻,每条用一句话总结,标注来源

这次就很顺利了。Hermes 先调用了内置的 blogwatcher 技能,然后用浏览器跑 Google、Bing 搜索,还用 Python 脚本抓了 Reuters 的内容。
在这里插入图片描述
最终返回 3 条新闻,来源链接点进去真实可访问。
在这里插入图片描述
中间有个细节我觉得设计得很好:Python 脚本要访问 reuters.com 时,安全扫描拦截了,直接在飞书聊天窗里弹出审批卡片——Allow Once / Session / Always / Deny,四个按钮。点一下就放行。
在这里插入图片描述
用过 OpenClaw 的应该知道,之前这种权限控制得改配置文件,或者去 Web UI 后台审批。Hermes 直接把审批按钮放进了飞书聊天窗,不用切换界面,体验好太多了。

跨平台记忆

这个场景我最好奇。"越用越聪明"是不是真的?

我设计了一个测试:在 CLI 端定义一个总结模板,然后切到飞书看它还记不记得。

CLI 端:

以后帮我总结文章的时候,用这个格式:先写一句话总结,再列 3 个关键要点,最后给一个评分(1-5 分)

Hermes 说"记住了"。我看到它调用了 memory +user,把偏好存了下来。
在这里插入图片描述
切到飞书,发了一篇 Reddit 帖子让它总结。

结果——模板生效了。一句话总结、关键要点、评分,格式完全对。CLI 里说的话,飞书里也记得。
在这里插入图片描述
更有意思的是,完成总结后,Hermes 自动创建了一个 Skill 叫 reddit-post-fallback-summary。意思是下次再让它总结 Reddit 帖子,它会直接调用这个技能。真的在"学习"。

但也有点过度热情——任务结束后它自作主张又创建了一个 cron job,没人让它这么干。有时候聪明和自作主张只有一线之隔。
在这里插入图片描述

一个下午的真实感受

先放一张对比表,再说感受:

能力 OpenClaw Hermes
安装 一行命令 + CLI 引导 一行命令 + CLI 引导(持平)
联网搜索 需要自己配 Search API 内置浏览器,开箱即用
语音消息 需要装 STT 插件 开箱即用
认证 手动配 API key 自动检测 Codex CLI token
权限审批 改配置文件 / Web UI 飞书聊天内按钮
定时任务 能用(但费 token) 创建成功但没执行
跨平台记忆 CLI ↔ 飞书记忆互通
自动技能 完成任务后自动创建

最惊喜的是开箱体验。 OpenClaw 装完之后,基础功能都得自己折腾。Hermes 装完就能直接干活。不是某个功能强,是整体思路不一样。

最失望的是 cron job。 创建说成功了,实际没执行,事后查也找不到。官方主打的功能,在我这次测试中是个空壳。而且 Hermes 偶尔会自作主张创建 cron job,这个习惯让人不太放心。

会不会继续用?会的。 联网搜索、跨平台记忆、飞书集成,这几个核心能力已经稳了。cron 的问题大概率是 bug,Hermes 迭代很快(6 周发了 7 个版本),应该很快能修。

还有两个问题我这次没来得及深挖。一个是 token 用量——用过 OpenClaw 的都知道,token 烧得飞快是最大的痛点之一,Hermes 这边会不会好一点?

另一个是 Skill 管理。我现在同时用着 Claude Code、Codex、再加上 Hermes,三套 Agent 各自在攒自己的 Skill 和工作流。Hermes 的 auto-skill 看着很酷,但这些技能散落在不同系统里——怎么管理?能不能迁移?后续文章会专门讨论这个问题。

现在该不该上手

适合现在用的:

  • 想要一个接飞书的个人 AI 助手
  • 之前用 OpenClaw 被配置劝退的
  • 愿意接受早期产品的小毛病,换一个"越用越聪明"的长期伙伴

可以再等等的:

  • 重度依赖定时任务——cron 目前不靠谱
  • 需要稳定生产环境——Hermes 还在快速迭代期,行为可能随时变

如果你也在用 Hermes Agent 或类似的开源 AI Agent,遇到了什么问题或者有什么好用的配置方案,欢迎在评论区讨论。

Logo

小龙虾开发者社区是 CSDN 旗下专注 OpenClaw 生态的官方阵地,聚焦技能开发、插件实践与部署教程,为开发者提供可直接落地的方案、工具与交流平台,助力高效构建与落地 AI 应用

更多推荐