2026年AI开源圈最火趋势:Hermes Agent,让AI“活”起来自进化Agent引领新革命!
2026年AI开源圈最火的词,不是模型,而是Agent。
两个月前,开发者们还在热烈讨论OpenClaw(俗称“龙虾”)这个AI操作系统新物种;两个月后,风向突然转向了一个名字听起来就很贵的开源项目——Hermes Agent。因为和奢侈品牌撞名,国内开发者亲切地喊它“爱马仕”。
上线仅六周,Hermes就在GitHub上狂揽超6.4万颗星,连续多日霸榜全球开源榜单第一,增速是同期OpenClaw的三倍有余。YC CEO Garry Tan亲自上手后直呼“彻底回不去了”,Anthropic甚至被指控在“复制”它的功能。 这匹“爱马仕”到底凭什么?
一句话记住它:OpenClaw是养龙虾(),Hermes是养马()。龙虾需要你喂,马会自己找草吃,越骑越顺。
下面,我们就来深度解剖这匹会“自进化”的神马。
一、Hermes 是什么?——5 岁小孩也能懂
想象你请了一个数字助手:
- 普通 AI(如 ChatGPT) :每次聊天都是新认识,昨天聊的今天就忘。
- Hermes:越聊越懂你,第 10 次比第 1 次好用得多。
这就像你新认识一个朋友:刚开始只是泛泛之交,相处久了,他知道你喜欢喝什么咖啡、几点起床、说话有什么习惯——然后在你开口之前,他已经帮你准备好了。
官方用一句话精准概括了这个定位:“The Agent That Grows With You”(和你一起成长的 Agent)。它不是“用完即走”的工具,而是会积累、会进步的数字分身。
Hermes Agent由知名开源大模型机构Nous Research于2026年2月底推出。这家机构成立于2023年,团队约20人,核心成员来自StabilityAI,此前推出的Hermes、Nomos系列模型累计下载超5000万次。“训模人做Agent”的基因,让他们比单纯做工具的人更懂大模型的能力边界——这也是Hermes能在技术上超越前任王者OpenClaw的深层原因。
核心配方一览:
| 维度 | 数据 |
|---|---|
| 最低成本 | $5/月 VPS,24 小时在线 |
| GitHub Stars | 突破 7 万(发布两个月) |
| 内置工具 | 40+ |
| 支持平台 | 16 个(Telegram/Discord/Slack/微信/飞书/钉钉等) |
| MCP 可接入 | 6,000+ 应用 |
| 迭代速度 | 平均不到一周一个大版本 |
二、为什么叫“养马”?和“养虾”有什么区别?
这个比喻非常形象,正好打中了两个产品最核心的设计差异。
养虾(OpenClaw) :
- 你养了一池龙虾
- 每只龙虾都听你指挥
- 数量多、好管理
- 但每只都不认识你,每次都要重新教
OpenClaw本质上是一个“广连接”的网关系统,强调多平台接入和多Agent编排,它的技能完全依赖人工编写或从社区下载,缺乏自我进化能力。
养马(Hermes) :
- 你养了一匹马
- 刚开始不熟悉,跑得不快
- 骑多了它懂你的习惯、脾气、偏好
- 第 10 次比第 1 次顺多了
用一句业内广为流传的总结来说:Hermes 是教 AI “怎么把活干好”;OpenClaw 是在解决 “怎么管好这帮干活的 AI” 。
两者的本质区别在于“自进化闭环”。Hermes完成复杂任务后,会自动把解决方案提炼成可复用的技能文件;使用中发现不足,还能自动“打补丁”优化。而OpenClaw是静态的——你教它什么,它就只会什么,技能需要人工编写、安装、维护。
社区验证了一个重要事实:两者并非水火不容,而是可以协同使用。Hermes负责记住偏好、积累技能、沉淀记忆;OpenClaw负责利用其庞大的技能生态执行具体任务。甚至社区已催生出专门的桥接工具HermesClaw,让一个微信机器人同时接入两个Agent。
三、Hermes 是怎么“长脑子”的?——学习循环五部曲
Hermes的核心竞争力,在于其内建的学习闭环。这个闭环由五个环节组成,持续运转:
干活 → 复盘 → 写手册 → 优化 → 再用
具体拆解:
- 策划记忆:每次任务后,Agent主动判断哪些信息值得存入数据库,而不是被动存储全部内容
- 创建 Skill:发现新套路,自动写成操作手册(Markdown格式)
- Skill 自改进:老手册不好用,自动打补丁优化
- FTS5 召回:需要时通过全文搜索快速找到相关手册
- 用户建模:通过可选的Honcho系统,分析交互行为,推断深层偏好
真实例子:写爬虫
- 第 1 次:你说“帮我写个爬虫抓标题”。Hermes写了一个基础版本,但风格可能不符合你的习惯——变量命名、错误处理方式都需要你手动调整。
- 第 10 次:你说“抓这个网站的标题”。Hermes已经知道:你偏好 httpx 而不是 requests你习惯把错误日志写到文件你的项目结构是 src/ 目录下按模块分你讨厌过长的函数
没人教它这些。它是自己学会的。
更惊艳的是它的进化算法。Hermes内置了一套离线批量进化算法,使用DSPy框架和GEPA(Genetic-Pareto Prompt Evolution)核心算法——这套方法出自一篇ICLR 2026 Oral论文,标题就叫《反思性提示词进化可以跑赢强化学习》。这已经不是简单的“记忆”,而是真正的“学习”。
四、记忆系统:从“金鱼记忆”到“老友记”
如果说传统AI是只有7秒记忆的金鱼,那Hermes就是一个对你知根知底的老朋友。它的记忆架构从最初的三层演进到了更精密的五层漏斗模型。
传统三层记忆(官方基础模型)
第一层:情景记忆(发生了什么)
- 存对话记录
- 用 SQLite + 全文搜索(FTS5)
- 按需检索,不是每次都加载全部历史
第二层:语义记忆(你是谁)
- 编码偏好、常用工具链、工作时间规律
- 存储在USER.md文件中,约500 tokens
第三层:程序性记忆(怎么做事)
- Skill 文件(Markdown 格式)
- 可编辑、可复用
- 会自我进化
v0.9.0 五层记忆架构(更精密的漏斗模型)
最新版本进一步优化为五层结构:
- L1 核心记忆:存储在MEMORY.md中,严格限制约800 tokens,每次会话冻结为快照注入系统提示词
- L2 用户画像:记录沟通风格、技术栈偏好、工作习惯
- L3 长时记忆:SQLite持久化,支持全文检索
- L4 技能记忆:可复用的方法论沉淀
- L5 血缘追溯:每条记忆都记录来源,确保可解释性
这五层记忆让Agent真正具备了“随时间成长”的能力,而不会像传统的向量检索RAG那样产生“幻觉”或检索漂移。
五、怎么安装?——三种方式,新手不迷路
Hermes的安装门槛极低,一行命令就能搞定。但为了让你少走弯路,这里把三种方式都讲透。
方式一:本地安装(5 分钟)
# 一键安装curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash# 配置hermes setup# 启动hermes
支持平台:Linux、macOS、Windows WSL2、Android Termux。原生Windows暂不支持,需要先安装WSL2。
方式二:Docker(干净隔离)
docker pull nousresearch/hermes-agent:latestdocker run -v ~/.hermes:/opt/data nousresearch/hermes-agent:latest
方式三:$5 VPS 24/7(最推荐)
让Hermes在云端7×24小时运行,这才是它真正的用法。
- 推荐配置:Ubuntu 22.04 LTS,内存 >500MB
- 推荐服务商:Hetzner / DigitalOcean / Vultr / 阿里云轻量服务器
装完之后别忘了运行 hermes model 配置大模型API。Hermes兼容GPT、Claude、GLM、DeepSeek、Kimi、Qwen等主流模型,要求模型上下文窗口至少64K。
避坑提示:安装后若提示 hermes: command not found,执行 source ~/.bashrc 或 source ~/.zshrc 重载shell即可。Windows用户务必使用WSL2,原生CMD/PowerShell不支持。
六、v0.9.0 新功能:“无处不在版”
2026年4月13日,Hermes发布了v0.9.0版本,包含487个commit和269个合并PR,是一次以“平台扩展”为主题的大版本更新。
最受瞩目的新功能:
- Termux/Android:手机上跑完整 Hermes
- 微信原生接入:通过腾讯官方iLink Bot API,公网服务器扫码即连
- iMessage:通过 BlueBubbles 接入
- 企业微信回调模式:面向自建应用的完整适配
- Fast Mode:接入OpenAI/Anthropic快速通道,降低推理延迟
- Web 仪表板:在浏览器中配置设置、管理技能、监控会话,无需手改配置文件
- 后台进程监控:实时监控后台进程输出,模式匹配触发通知
- 可插拔上下文引擎:通过插件自定义每轮上下文内容
- 备份导入命令:hermes backup 和 hermes import 完整迁移配置
设计理念很打动人:**“不是你来我家,是我在你家等你”** 。目前Hermes已覆盖16个通讯平台,国内主流IM——钉钉、飞书、企业微信、微信——全部接全。
Nous Research官方还专门发了一条中文推文,用中文跟中国用户互动。中文为什么这么顺?他们自己揭了底:请Hermes帮忙润色的。
七、实战场景:Hermes 能帮你做什么?
理论说了这么多,不如看看实战。以下是四个典型场景,展示Hermes如何真正落地。
场景一:个人知识助手(跨会话记忆的威力)
问题:传统AI每次对话都从零开始,调研一个话题需要反复解释背景。
Hermes方案:假设你在调研AI Agent部署方案,持续三周——
第一周:你问了Docker部署内存占用、VPS价格对比、Daytona免费额度限制。
第二周:你直接说“继续看Serverless方案”——
- Hermes记得你在调研什么
- 主动提醒:“上周你提到Daytona有免费额度限制,要确认最新政策吗?”
- 不会重新推荐你已排除的方案
第三周:方法论已经沉淀为Skill——
- “调研类任务:先列维度→逐个深挖→每轮汇总”
- 第二个调研项目自动复用
场景二:内容创作(从调研到成稿)
问题:用AI写文章不稀奇,但每次都要重新说明风格偏好。
Hermes方案:连续写5篇AI Agent文章。
风格Skill自改进示例:
初始 Skill:# 写作风格- 别用“综上所述”- 段落保持3-5行- 多用“我觉得”“其实”这类口语词使用一个月后自动进化:# 写作风格(已进化)- 别用“综上所述”、“值得注意的是”- 段落保持3-5行- 多用“我觉得”“其实”这类口语词- 避免用“进行+动词”的句式(把“进行优化”改为“优化一下”)- 结尾不要强行升华- 技术概念首次出现要加一句话解释- 代码示例控制在15行以内
子Agent并行调研:写一篇AI Agent对比文章时,同时派出三个子Agent——每个只分配web+browser两个工具,独立调研Claude Code、Cursor、Hermes Agent,按统一模板输出,最后主Agent汇总。
- 线性调研:40分钟
- 并行调研:15分钟
场景三:开发自动化(代码审查到部署)
典型早晨:早上9点打开飞书,收到Hermes发的消息:
“昨晚23:17,main分支有PR合并,新增387行代码。审查了一下有两个问题:auth模块的token过期逻辑没处理边界情况;测试覆盖率从82%掉到76%。详细报告已存到项目Skill里。” “凌晨2:40,CI流水线跑了一轮回归测试,3个用例失败。2个是昨天那个PR引入的,1个是已知的flaky test。” “今天的日报初稿已生成,基于昨天的4个commit和2个PR。需要你确认后发送。”
这不是假想场景。这是cron调度+GitHub MCP+记忆系统的组合效果。
关键差异:
- 传统lint规则是静态的
- Hermes的审查标准是活的——你标记了它没发现的问题,下次就会注意同类模式
场景四:多Agent编排(让三匹马同时跑)
适用场景:任务复杂到单Agent上下文不够用,或需要并行加速。
实际案例:竞品分析报告
传统做法:一个一个调研,然后手动整合(90分钟)
Hermes做法:
- 主Agent拆分任务+定义模板
- 并行派三个子Agent:调研产品A/B/C
- 每个子Agent只有web+browser两个工具(最小权限原则)
- 主Agent汇总整合三份调研结果,生成对比报告
- 并发上限3个,防止汇总质量下降
八、MCP:连接 6,000+ 应用
MCP(Model Context Protocol,模型上下文协议)是Hermes实现广泛连接的关键。通过MCP,Hermes可以接入GitHub、数据库、Slack、Jira等6,000多个服务。
配置示例:
mcp_servers: github:command: "npx"args: ["-y", "@modelcontextprotocol/server-github"]env:GITHUB_PERSONAL_ACCESS_TOKEN: "ghp_xxxxx"allowed_tools: # 白名单,最小权限- "list_issues"- "create_issue"- "get_pull_request"
MCP + Skill 组合最佳实践:
- MCP 提供读取 PR 的能力
- Skill 定义你的审查标准
- 两者结合 = 按你的标准自动审查代码
v0.6.0版本还新增了MCP Server Mode,允许将Hermes的对话和会话暴露给任何MCP兼容客户端(Claude Desktop、Cursor、VS Code等)。
九、对比:Claude Code vs OpenClaw vs Hermes
了解三者的差异,能帮你做出更好的选择。
| 维度 | Claude Code | OpenClaw | Hermes Agent |
|---|---|---|---|
| 核心定位 | 交互式编码助手 | 多渠道个人助理OS | 自进化Agent运行时 |
| 技术栈 | - | Node.js+TypeScript | Python+FastAPI |
| 记忆能力 | 静态/会话级 | 手动维护Markdown | 五层自动记忆+自进化 |
| 微信接入 | - | 第三方插件 | 官方原生支持 |
| 学习能力 | 无 | 静态配置 | 自主学习循环 |
| 安全设计 | - | 需手动配置 | 默认沙盒+审批 |
| 社区迭代 | 稳定 | 放缓 | 极速迭代 |
| 技能生态 | - | ClawHub 13,000+ | 起步但增速快 |
关键洞察:很多场景不是一个工具就能搞定的。
- 长期内容项目:Hermes负责每天自动搜集信息、积累记忆
- 深度编码开发:Claude Code负责坐下来把东西写出来
- 多渠道任务调度:OpenClaw利用其成熟技能生态执行
各管一摊,协同作战。
十、什么人适合装 Hermes?
✅ 适合的人
- 想要后台自主运行的Agent——不是盯着看,是睡觉也干活
- 对Harness Engineering好奇——看方法论产品化后的样子
- 数据隐私敏感——自托管,数据不离开自己服务器
- 内容创作/知识管理——需要积累个人风格的助手
- 有$5/月预算——Hetzner/DigitalOcean/Vultr VPS即可
❌ 不适合的人
- 只想快速验证一次性任务 → ChatGPT/Claude Code够了
- 不想折腾配置 → Claude Code/Cursor订阅更省心
- 企业合规要完全可审计 → OpenClaw更透明
十一、从 OpenClaw 迁移
如果你已经有OpenClaw(或旧版Clawdbot/Moldbot),Hermes提供了官方迁移工具,一键导入配置。
# 预览将执行的操作(不修改任何文件)hermes claw migrate --dry-run# 执行迁移(默认不包含密钥)hermes claw migrate# 完整迁移,包含API密钥hermes claw migrate --preset full
迁移默认从 ~/.openclaw/ 读取配置。如果仍有旧版 ~/.clawdbot/ 或 ~/.moldbot/ 目录,系统会自动检测。
迁移内容包括:人格设定、记忆文件、API配置、技能包。OpenClaw的Skill可以直接带过来继续用。
十二、决策框架(截图保存)
选型其实不复杂,一张图帮你快速判断:
□ 只是想快速写代码 → Claude Code□ 给团队定制Agent,要可审计 → OpenClaw□ 想要24/7在线的私人助手 → Hermes Agent□ 长期内容项目,要积累风格 → Hermes + Claude Code□ 数据不能离开自己服务器 → Hermes(MIT自托管)□ 企业合规,SOC2/HIPAA → OpenClaw
Hermes 安装速查路径:
- $5/月 VPS(Hetzner/DigitalOcean/Vultr)
- curl 一键脚本安装
- hermes model 配置API Key
- hermes gateway setup 配消息平台
- 定期审查 ~/.hermes/skills/ 和持久记忆
十三、关键资源
官方资源
- GitHub:https://github.com/nousresearch/hermes-agent
- 官网:https://hermes-agent.nousresearch.com/
- 官方文档:https://hermes-agent.nousresearch.com/docs/
社区资源
- 中文文档:https://hermes-doc.aigc.green/
- Hermes橙皮书:《Hermes Agent从入门到精通》
- Skills Hub:agentskills.io(开源技能标准,社区可共享)
- Twitter:@Teknium(创始人)、@NousResearch(官方)
最后
对于正在迷茫择业、想转行提升,或是刚入门的程序员、编程小白来说,有一个问题几乎人人都在问:未来10年,什么领域的职业发展潜力最大?
答案只有一个:人工智能(尤其是大模型方向)
当下,人工智能行业正处于爆发式增长期,其中大模型相关岗位更是供不应求,薪资待遇直接拉满——字节跳动作为AI领域的头部玩家,给硕士毕业的优质AI人才(含大模型相关方向)开出的月基础工资高达5万—6万元;即便是非“人才计划”的普通应聘者,月基础工资也能稳定在4万元左右。
再看阿里、腾讯两大互联网大厂,非“人才计划”的AI相关岗位应聘者,月基础工资也约有3万元,远超其他行业同资历岗位的薪资水平,对于程序员、小白来说,无疑是绝佳的转型和提升赛道。
如果你还不知道从何开始,我自己整理一套全网最全最细的大模型零基础教程,我也是一路自学走过来的,很清楚小白前期学习的痛楚,你要是没有方向还没有好的资源,根本学不到东西!
下面是我整理的大模型学习资源,希望能帮到你。

👇👇扫码免费领取全部内容👇👇

最后
1、大模型学习路线

2、从0到进阶大模型学习视频教程
从入门到进阶这里都有,跟着老师学习事半功倍。

3、 入门必看大模型学习书籍&文档.pdf(书面上的技术书籍确实太多了,这些是我精选出来的,还有很多不在图里)

4、 AI大模型最新行业报告
2026最新行业报告,针对不同行业的现状、趋势、问题、机会等进行系统地调研和评估,以了解哪些行业更适合引入大模型的技术和应用,以及在哪些方面可以发挥大模型的优势。

5、面试试题/经验

【大厂 AI 岗位面经分享(107 道)】

【AI 大模型面试真题(102 道)】

【LLMs 面试真题(97 道)】

6、大模型项目实战&配套源码

适用人群

四阶段学习规划(共90天,可落地执行)
第一阶段(10天):初阶应用
该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。
- 大模型 AI 能干什么?
- 大模型是怎样获得「智能」的?
- 用好 AI 的核心心法
- 大模型应用业务架构
- 大模型应用技术架构
- 代码示例:向 GPT-3.5 灌入新知识
- 提示工程的意义和核心思想
- Prompt 典型构成
- 指令调优方法论
- 思维链和思维树
- Prompt 攻击和防范
- …
第二阶段(30天):高阶应用
该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。
- 为什么要做 RAG
- 搭建一个简单的 ChatPDF
- 检索的基础概念
- 什么是向量表示(Embeddings)
- 向量数据库与向量检索
- 基于向量检索的 RAG
- 搭建 RAG 系统的扩展知识
- 混合检索与 RAG-Fusion 简介
- 向量模型本地部署
- …
第三阶段(30天):模型训练
恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。
到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?
- 为什么要做 RAG
- 什么是模型
- 什么是模型训练
- 求解器 & 损失函数简介
- 小实验2:手写一个简单的神经网络并训练它
- 什么是训练/预训练/微调/轻量化微调
- Transformer结构简介
- 轻量化微调
- 实验数据集的构建
- …
第四阶段(20天):商业闭环
对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。
-
硬件选型
-
带你了解全球大模型
-
使用国产大模型服务
-
搭建 OpenAI 代理
-
热身:基于阿里云 PAI 部署 Stable Diffusion
-
在本地计算机运行大模型
-
大模型的私有化部署
-
基于 vLLM 部署大模型
-
案例:如何优雅地在阿里云私有部署开源大模型
-
部署一套开源 LLM 项目
-
内容安全
-
互联网信息服务算法备案
-
…
👇👇扫码免费领取全部内容👇👇

3、这些资料真的有用吗?
这份资料由我和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理,现任上海殷泊信息科技CEO,其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证,服务航天科工、国家电网等1000+企业,以第一作者在IEEE Transactions发表论文50+篇,获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。
资料内容涵盖了从入门到进阶的各类视频教程和实战项目,无论你是小白还是有些技术基础的技术人员,这份资料都绝对能帮助你提升薪资待遇,转行大模型岗位。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

更多推荐




所有评论(0)