2026年AI开源圈最火趋势：Hermes Agent，让AI“活”起来自进化Agent引领新革命！

乔代码嘚

222人浏览 · 2026-06-11 10:57:47

乔代码嘚 · 2026-06-11 10:57:47 发布

2026年AI开源圈最火的词，不是模型，而是Agent。

两个月前，开发者们还在热烈讨论OpenClaw（俗称“龙虾”）这个AI操作系统新物种；两个月后，风向突然转向了一个名字听起来就很贵的开源项目——Hermes Agent。因为和奢侈品牌撞名，国内开发者亲切地喊它“爱马仕”。

上线仅六周，Hermes就在GitHub上狂揽超6.4万颗星，连续多日霸榜全球开源榜单第一，增速是同期OpenClaw的三倍有余。YC CEO Garry Tan亲自上手后直呼“彻底回不去了”，Anthropic甚至被指控在“复制”它的功能。 这匹“爱马仕”到底凭什么？

一句话记住它：OpenClaw是养龙虾（），Hermes是养马（）。龙虾需要你喂，马会自己找草吃，越骑越顺。

下面，我们就来深度解剖这匹会“自进化”的神马。

一、Hermes 是什么？——5 岁小孩也能懂

想象你请了一个数字助手：

普通 AI（如 ChatGPT） ：每次聊天都是新认识，昨天聊的今天就忘。
Hermes：越聊越懂你，第 10 次比第 1 次好用得多。

这就像你新认识一个朋友：刚开始只是泛泛之交，相处久了，他知道你喜欢喝什么咖啡、几点起床、说话有什么习惯——然后在你开口之前，他已经帮你准备好了。

官方用一句话精准概括了这个定位：“The Agent That Grows With You”（和你一起成长的 Agent）。它不是“用完即走”的工具，而是会积累、会进步的数字分身。

Hermes Agent由知名开源大模型机构Nous Research于2026年2月底推出。这家机构成立于2023年，团队约20人，核心成员来自StabilityAI，此前推出的Hermes、Nomos系列模型累计下载超5000万次。“训模人做Agent”的基因，让他们比单纯做工具的人更懂大模型的能力边界——这也是Hermes能在技术上超越前任王者OpenClaw的深层原因。

核心配方一览：

维度	数据
最低成本	$5/月 VPS，24 小时在线
GitHub Stars	突破 7 万（发布两个月）
内置工具	40+
支持平台	16 个（Telegram/Discord/Slack/微信/飞书/钉钉等）
MCP 可接入	6,000+ 应用
迭代速度	平均不到一周一个大版本

二、为什么叫“养马”？和“养虾”有什么区别？

这个比喻非常形象，正好打中了两个产品最核心的设计差异。

养虾（OpenClaw） ：

你养了一池龙虾
每只龙虾都听你指挥
数量多、好管理
但每只都不认识你，每次都要重新教

OpenClaw本质上是一个“广连接”的网关系统，强调多平台接入和多Agent编排，它的技能完全依赖人工编写或从社区下载，缺乏自我进化能力。

养马（Hermes） ：

你养了一匹马
刚开始不熟悉，跑得不快
骑多了它懂你的习惯、脾气、偏好
第 10 次比第 1 次顺多了

用一句业内广为流传的总结来说：Hermes 是教 AI “怎么把活干好”；OpenClaw 是在解决 “怎么管好这帮干活的 AI” 。

两者的本质区别在于“自进化闭环”。Hermes完成复杂任务后，会自动把解决方案提炼成可复用的技能文件；使用中发现不足，还能自动“打补丁”优化。而OpenClaw是静态的——你教它什么，它就只会什么，技能需要人工编写、安装、维护。

社区验证了一个重要事实：两者并非水火不容，而是可以协同使用。Hermes负责记住偏好、积累技能、沉淀记忆；OpenClaw负责利用其庞大的技能生态执行具体任务。甚至社区已催生出专门的桥接工具HermesClaw，让一个微信机器人同时接入两个Agent。

三、Hermes 是怎么“长脑子”的？——学习循环五部曲

Hermes的核心竞争力，在于其内建的学习闭环。这个闭环由五个环节组成，持续运转：

干活 → 复盘 → 写手册 → 优化 → 再用

具体拆解：

策划记忆：每次任务后，Agent主动判断哪些信息值得存入数据库，而不是被动存储全部内容
创建 Skill：发现新套路，自动写成操作手册（Markdown格式）
Skill 自改进：老手册不好用，自动打补丁优化
FTS5 召回：需要时通过全文搜索快速找到相关手册
用户建模：通过可选的Honcho系统，分析交互行为，推断深层偏好

真实例子：写爬虫

第 1 次：你说“帮我写个爬虫抓标题”。Hermes写了一个基础版本，但风格可能不符合你的习惯——变量命名、错误处理方式都需要你手动调整。
第 10 次：你说“抓这个网站的标题”。Hermes已经知道：你偏好 httpx 而不是 requests你习惯把错误日志写到文件你的项目结构是 src/ 目录下按模块分你讨厌过长的函数

没人教它这些。它是自己学会的。

更惊艳的是它的进化算法。Hermes内置了一套离线批量进化算法，使用DSPy框架和GEPA（Genetic-Pareto Prompt Evolution）核心算法——这套方法出自一篇ICLR 2026 Oral论文，标题就叫《反思性提示词进化可以跑赢强化学习》。这已经不是简单的“记忆”，而是真正的“学习”。

四、记忆系统：从“金鱼记忆”到“老友记”

如果说传统AI是只有7秒记忆的金鱼，那Hermes就是一个对你知根知底的老朋友。它的记忆架构从最初的三层演进到了更精密的五层漏斗模型。

传统三层记忆（官方基础模型）

第一层：情景记忆（发生了什么）

存对话记录
用 SQLite + 全文搜索（FTS5）
按需检索，不是每次都加载全部历史

第二层：语义记忆（你是谁）

编码偏好、常用工具链、工作时间规律
存储在USER.md文件中，约500 tokens

第三层：程序性记忆（怎么做事）

Skill 文件（Markdown 格式）
可编辑、可复用
会自我进化

v0.9.0 五层记忆架构（更精密的漏斗模型）

最新版本进一步优化为五层结构：

L1 核心记忆：存储在MEMORY.md中，严格限制约800 tokens，每次会话冻结为快照注入系统提示词
L2 用户画像：记录沟通风格、技术栈偏好、工作习惯
L3 长时记忆：SQLite持久化，支持全文检索
L4 技能记忆：可复用的方法论沉淀
L5 血缘追溯：每条记忆都记录来源，确保可解释性

这五层记忆让Agent真正具备了“随时间成长”的能力，而不会像传统的向量检索RAG那样产生“幻觉”或检索漂移。

五、怎么安装？——三种方式，新手不迷路

Hermes的安装门槛极低，一行命令就能搞定。但为了让你少走弯路，这里把三种方式都讲透。

方式一：本地安装（5 分钟）

# 一键安装curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash# 配置hermes setup# 启动hermes

支持平台：Linux、macOS、Windows WSL2、Android Termux。原生Windows暂不支持，需要先安装WSL2。

方式二：Docker（干净隔离）

docker pull nousresearch/hermes-agent:latestdocker run -v ~/.hermes:/opt/data nousresearch/hermes-agent:latest

方式三：$5 VPS 24/7（最推荐）

让Hermes在云端7×24小时运行，这才是它真正的用法。

推荐配置：Ubuntu 22.04 LTS，内存 >500MB
推荐服务商：Hetzner / DigitalOcean / Vultr / 阿里云轻量服务器

装完之后别忘了运行 hermes model 配置大模型API。Hermes兼容GPT、Claude、GLM、DeepSeek、Kimi、Qwen等主流模型，要求模型上下文窗口至少64K。

避坑提示：安装后若提示 hermes: command not found，执行 source ~/.bashrc 或 source ~/.zshrc 重载shell即可。Windows用户务必使用WSL2，原生CMD/PowerShell不支持。

六、v0.9.0 新功能：“无处不在版”

2026年4月13日，Hermes发布了v0.9.0版本，包含487个commit和269个合并PR，是一次以“平台扩展”为主题的大版本更新。

最受瞩目的新功能：

Termux/Android：手机上跑完整 Hermes
微信原生接入：通过腾讯官方iLink Bot API，公网服务器扫码即连
iMessage：通过 BlueBubbles 接入
企业微信回调模式：面向自建应用的完整适配
Fast Mode：接入OpenAI/Anthropic快速通道，降低推理延迟
Web 仪表板：在浏览器中配置设置、管理技能、监控会话，无需手改配置文件
后台进程监控：实时监控后台进程输出，模式匹配触发通知
可插拔上下文引擎：通过插件自定义每轮上下文内容
备份导入命令：hermes backup 和 hermes import 完整迁移配置

设计理念很打动人：**“不是你来我家，是我在你家等你”** 。目前Hermes已覆盖16个通讯平台，国内主流IM——钉钉、飞书、企业微信、微信——全部接全。

Nous Research官方还专门发了一条中文推文，用中文跟中国用户互动。中文为什么这么顺？他们自己揭了底：请Hermes帮忙润色的。

七、实战场景：Hermes 能帮你做什么？

理论说了这么多，不如看看实战。以下是四个典型场景，展示Hermes如何真正落地。

场景一：个人知识助手（跨会话记忆的威力）

问题：传统AI每次对话都从零开始，调研一个话题需要反复解释背景。

Hermes方案：假设你在调研AI Agent部署方案，持续三周——

第一周：你问了Docker部署内存占用、VPS价格对比、Daytona免费额度限制。

第二周：你直接说“继续看Serverless方案”——

Hermes记得你在调研什么
主动提醒：“上周你提到Daytona有免费额度限制，要确认最新政策吗？”
不会重新推荐你已排除的方案

第三周：方法论已经沉淀为Skill——

“调研类任务：先列维度→逐个深挖→每轮汇总”
第二个调研项目自动复用

场景二：内容创作（从调研到成稿）

问题：用AI写文章不稀奇，但每次都要重新说明风格偏好。

Hermes方案：连续写5篇AI Agent文章。

风格Skill自改进示例：

初始 Skill：# 写作风格- 别用“综上所述”- 段落保持3-5行- 多用“我觉得”“其实”这类口语词使用一个月后自动进化：# 写作风格（已进化）- 别用“综上所述”、“值得注意的是”- 段落保持3-5行- 多用“我觉得”“其实”这类口语词- 避免用“进行+动词”的句式（把“进行优化”改为“优化一下”）- 结尾不要强行升华- 技术概念首次出现要加一句话解释- 代码示例控制在15行以内

子Agent并行调研：写一篇AI Agent对比文章时，同时派出三个子Agent——每个只分配web+browser两个工具，独立调研Claude Code、Cursor、Hermes Agent，按统一模板输出，最后主Agent汇总。

线性调研：40分钟
并行调研：15分钟

场景三：开发自动化（代码审查到部署）

典型早晨：早上9点打开飞书，收到Hermes发的消息：

“昨晚23:17，main分支有PR合并，新增387行代码。审查了一下有两个问题：auth模块的token过期逻辑没处理边界情况；测试覆盖率从82%掉到76%。详细报告已存到项目Skill里。” “凌晨2:40，CI流水线跑了一轮回归测试，3个用例失败。2个是昨天那个PR引入的，1个是已知的flaky test。” “今天的日报初稿已生成，基于昨天的4个commit和2个PR。需要你确认后发送。”

这不是假想场景。这是cron调度+GitHub MCP+记忆系统的组合效果。

关键差异：

传统lint规则是静态的
Hermes的审查标准是活的——你标记了它没发现的问题，下次就会注意同类模式

场景四：多Agent编排（让三匹马同时跑）

适用场景：任务复杂到单Agent上下文不够用，或需要并行加速。

实际案例：竞品分析报告

传统做法：一个一个调研，然后手动整合（90分钟）

Hermes做法：

主Agent拆分任务+定义模板
并行派三个子Agent：调研产品A/B/C
每个子Agent只有web+browser两个工具（最小权限原则）
主Agent汇总整合三份调研结果，生成对比报告
并发上限3个，防止汇总质量下降

八、MCP：连接 6,000+ 应用

MCP（Model Context Protocol，模型上下文协议）是Hermes实现广泛连接的关键。通过MCP，Hermes可以接入GitHub、数据库、Slack、Jira等6,000多个服务。

配置示例：

mcp_servers:  github:command: "npx"args: ["-y", "@modelcontextprotocol/server-github"]env:GITHUB_PERSONAL_ACCESS_TOKEN: "ghp_xxxxx"allowed_tools:  # 白名单，最小权限- "list_issues"- "create_issue"- "get_pull_request"

MCP + Skill 组合最佳实践：

MCP 提供读取 PR 的能力
Skill 定义你的审查标准
两者结合 = 按你的标准自动审查代码

v0.6.0版本还新增了MCP Server Mode，允许将Hermes的对话和会话暴露给任何MCP兼容客户端（Claude Desktop、Cursor、VS Code等）。

九、对比：Claude Code vs OpenClaw vs Hermes

了解三者的差异，能帮你做出更好的选择。

维度	Claude Code	OpenClaw	Hermes Agent
核心定位	交互式编码助手	多渠道个人助理OS	自进化Agent运行时
技术栈	-	Node.js+TypeScript	Python+FastAPI
记忆能力	静态/会话级	手动维护Markdown	五层自动记忆+自进化
微信接入	-	第三方插件	官方原生支持
学习能力	无	静态配置	自主学习循环
安全设计	-	需手动配置	默认沙盒+审批
社区迭代	稳定	放缓	极速迭代
技能生态	-	ClawHub 13,000+	起步但增速快

关键洞察：很多场景不是一个工具就能搞定的。

长期内容项目：Hermes负责每天自动搜集信息、积累记忆
深度编码开发：Claude Code负责坐下来把东西写出来
多渠道任务调度：OpenClaw利用其成熟技能生态执行

各管一摊，协同作战。

十、什么人适合装 Hermes？

✅ 适合的人

想要后台自主运行的Agent——不是盯着看，是睡觉也干活
对Harness Engineering好奇——看方法论产品化后的样子
数据隐私敏感——自托管，数据不离开自己服务器
内容创作/知识管理——需要积累个人风格的助手
有$5/月预算——Hetzner/DigitalOcean/Vultr VPS即可

❌ 不适合的人

只想快速验证一次性任务 → ChatGPT/Claude Code够了
不想折腾配置 → Claude Code/Cursor订阅更省心
企业合规要完全可审计 → OpenClaw更透明

十一、从 OpenClaw 迁移

如果你已经有OpenClaw（或旧版Clawdbot/Moldbot），Hermes提供了官方迁移工具，一键导入配置。

# 预览将执行的操作（不修改任何文件）hermes claw migrate --dry-run# 执行迁移（默认不包含密钥）hermes claw migrate# 完整迁移，包含API密钥hermes claw migrate --preset full

迁移默认从 ~/.openclaw/ 读取配置。如果仍有旧版 ~/.clawdbot/ 或 ~/.moldbot/ 目录，系统会自动检测。

迁移内容包括：人格设定、记忆文件、API配置、技能包。OpenClaw的Skill可以直接带过来继续用。

十二、决策框架（截图保存）

选型其实不复杂，一张图帮你快速判断：

□ 只是想快速写代码 → Claude Code□ 给团队定制Agent，要可审计 → OpenClaw□ 想要24/7在线的私人助手 → Hermes Agent□ 长期内容项目，要积累风格 → Hermes + Claude Code□ 数据不能离开自己服务器 → Hermes（MIT自托管）□ 企业合规，SOC2/HIPAA → OpenClaw

Hermes 安装速查路径：

$5/月 VPS（Hetzner/DigitalOcean/Vultr）
curl 一键脚本安装
hermes model 配置API Key
hermes gateway setup 配消息平台
定期审查 ~/.hermes/skills/ 和持久记忆

十三、关键资源

官方资源

GitHub：https://github.com/nousresearch/hermes-agent
官网：https://hermes-agent.nousresearch.com/
官方文档：https://hermes-agent.nousresearch.com/docs/

社区资源

中文文档：https://hermes-doc.aigc.green/
Hermes橙皮书：《Hermes Agent从入门到精通》
Skills Hub：agentskills.io（开源技能标准，社区可共享）
Twitter：@Teknium（创始人）、@NousResearch（官方）

最后

对于正在迷茫择业、想转行提升，或是刚入门的程序员、编程小白来说，有一个问题几乎人人都在问：未来10年，什么领域的职业发展潜力最大？

答案只有一个：人工智能（尤其是大模型方向）

当下，人工智能行业正处于爆发式增长期，其中大模型相关岗位更是供不应求，薪资待遇直接拉满——字节跳动作为AI领域的头部玩家，给硕士毕业的优质AI人才（含大模型相关方向）开出的月基础工资高达5万—6万元；即便是非“人才计划”的普通应聘者，月基础工资也能稳定在4万元左右。

再看阿里、腾讯两大互联网大厂，非“人才计划”的AI相关岗位应聘者，月基础工资也约有3万元，远超其他行业同资历岗位的薪资水平，对于程序员、小白来说，无疑是绝佳的转型和提升赛道。

如果你还不知道从何开始，我自己整理一套全网最全最细的大模型零基础教程，我也是一路自学走过来的，很清楚小白前期学习的痛楚，你要是没有方向还没有好的资源，根本学不到东西！

下面是我整理的大模型学习资源，希望能帮到你。

👇👇扫码免费领取全部内容👇👇

在这里插入图片描述

最后

1、大模型学习路线

2、从0到进阶大模型学习视频教程

从入门到进阶这里都有，跟着老师学习事半功倍。

3、入门必看大模型学习书籍&文档.pdf（书面上的技术书籍确实太多了，这些是我精选出来的，还有很多不在图里）

4、 AI大模型最新行业报告

2026最新行业报告，针对不同行业的现状、趋势、问题、机会等进行系统地调研和评估，以了解哪些行业更适合引入大模型的技术和应用，以及在哪些方面可以发挥大模型的优势。

5、面试试题/经验

【大厂 AI 岗位面经分享（107 道）】

【AI 大模型面试真题（102 道）】

【LLMs 面试真题（97 道）】

6、大模型项目实战&配套源码

适用人群

四阶段学习规划（共90天，可落地执行）

第一阶段（10天）：初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识，对大模型 AI 的理解超过 95% 的人，可以在相关讨论时发表高级、不跟风、又接地气的见解，别人只会和 AI 聊天，而你能调教 AI，并能用代码将大模型和业务衔接。

大模型 AI 能干什么？
大模型是怎样获得「智能」的？
用好 AI 的核心心法
大模型应用业务架构
大模型应用技术架构
代码示例：向 GPT-3.5 灌入新知识
提示工程的意义和核心思想
Prompt 典型构成
指令调优方法论
思维链和思维树
Prompt 攻击和防范
…

第二阶段（30天）：高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习，学会构造私有知识库，扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架，抓住最新的技术进展，适合 Python 和 JavaScript 程序员。

为什么要做 RAG
搭建一个简单的 ChatPDF
检索的基础概念
什么是向量表示（Embeddings）
向量数据库与向量检索
基于向量检索的 RAG
搭建 RAG 系统的扩展知识
混合检索与 RAG-Fusion 简介
向量模型本地部署
…

第三阶段（30天）：模型训练

恭喜你，如果学到这里，你基本可以找到一份大模型 AI相关的工作，自己也能训练 GPT 了！通过微调，训练自己的垂直大模型，能独立训练开源多模态大模型，掌握更多技术方案。

到此为止，大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗？

为什么要做 RAG
什么是模型
什么是模型训练
求解器 & 损失函数简介
小实验2：手写一个简单的神经网络并训练它
什么是训练/预训练/微调/轻量化微调
Transformer结构简介
轻量化微调
实验数据集的构建
…

第四阶段（20天）：商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知，可以在云端和本地等多种环境下部署大模型，找到适合自己的项目/创业方向，做一名被 AI 武装的产品经理。

硬件选型
带你了解全球大模型
使用国产大模型服务
搭建 OpenAI 代理
热身：基于阿里云 PAI 部署 Stable Diffusion
在本地计算机运行大模型
大模型的私有化部署
基于 vLLM 部署大模型
案例：如何优雅地在阿里云私有部署开源大模型
部署一套开源 LLM 项目
内容安全
互联网信息服务算法备案
…

👇👇扫码免费领取全部内容👇👇

3、这些资料真的有用吗？

这份资料由我和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理，现任上海殷泊信息科技CEO，其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证，服务航天科工、国家电网等1000+企业，以第一作者在IEEE Transactions发表论文50+篇，获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。

资料内容涵盖了从入门到进阶的各类视频教程和实战项目，无论你是小白还是有些技术基础的技术人员，这份资料都绝对能帮助你提升薪资待遇，转行大模型岗位。