Hermes Agent 实操指南:从安装部署到多场景落地
想要上手 Hermes Agent,无需复杂的前置技术储备,官方提供了多样化部署方案、完善的交互能力与扩展接口。本文结合官方实操内容,一步步带大家完成环境搭建、基础对话、基础配置、多平台接入、自定义技能与工具集成,让这款具备自改进能力的 AI Agent 快速投入使用。
多样部署方式,适配不同使用场景
Hermes Agent 提供三种主流安装模式,分别面向本地体验、环境隔离与全天候服务需求,开发者可以根据自身使用习惯和运行环境自由选择。
本地安装是最快上手的方式,适配 macOS、Linux 以及 WSL2 环境,仅依赖 Git 工具。打开终端,执行官方一键安装脚本,程序会自动补齐 Python、Node.js 等全部依赖,全程无需手动配置环境变量。
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash
安装完成后,找到核心配置文件 ~/.hermes/config.yaml,填入大模型服务商与对应的 API 密钥,在终端输入启动命令,就能直接进入对话界面。
# 启动 Hermes Agent
hermes
# 查看版本,验证安装是否成功
hermes --version
这种方式适合初次体验、本地调试功能的用户,五分钟内即可完成整套流程。如果习惯使用 uv 管理 Python 环境,也可以通过下方命令完成安装:
uv pip install hermes-agent
如果追求运行环境纯净度,Docker 部署会是更优选择。先拉取官方镜像,再通过挂载数据目录启动容器,容器内所有配置、记忆文件、技能文档都会同步保存到宿主机。即便容器删除重建,历史数据也不会丢失,彻底规避本地环境依赖冲突的问题,同时也能实现多设备间的数据迁移。
# 拉取最新官方镜像
docker pull nousresearch/hermes-agent:latest
# 启动容器,挂载数据目录持久化文件
docker run -v ~/.hermes:/opt/data nousresearch/hermes-agent:latest
对于希望打造 24 小时在线私人助手的用户,轻量 VPS 部署性价比极高。每月仅需 5 美元左右的基础服务器,搭配 Ubuntu 22.04 系统就能稳定运行。在不部署本地大模型的前提下,程序内存占用低于 500MB,主流低价云主机均可流畅承载。VPS 部署流程和本地安装完全一致,SSH 登录服务器后,直接执行前文的一键安装脚本即可。此外框架还支持 Serverless 部署方案,借助 Daytona、Modal 等平台实现空闲休眠、消息触发唤醒,进一步降低闲置时段的资源消耗与使用成本,只需在配置文件中修改终端类型就能启用。
基础配置详解,打通大模型调用链路
config.yaml 是 Hermes Agent 的核心配置文件,所有运行规则、模型对接、平台接入参数都集中在此,简洁的设计大幅降低了配置门槛,文件默认路径为 ~/.hermes/config.yaml。
模型相关配置决定 Agent 的底层能力,框架兼容市面上主流大模型服务。下面是一份最小可用的配置示例,可直接参照修改使用:
model:
provider: openrouter
api_key: sk-or-xxxxx
model: anthropic/claude-sonnet-4
terminal: local
通过 OpenRouter 可调用两百余款模型,灵活切换适配不同任务;选择 Nous Portal 则能使用官方 Hermes 系列模型,兼容性与适配性更佳。国内用户可以接入智谱 GLM-5 等服务,网络访问更稳定。注重数据隐私的用户,还能搭配 Ollama 在本地运行开源模型,实现完全离线使用。需要注意的是,相关第三方调用规则更新后,优先选择按量计费的 API 方式,能保障服务正常使用。
终端运行模式同样在配置文件中定义,不同模式对应不同的执行环境。local 模式直接在本机执行命令与代码,操作最简单;docker 模式将代码运行在沙箱容器内,提升系统安全性;ssh 模式支持连接远程服务器执行任务,而 daytona、modal 等配置则专门面向按需唤醒的轻量化场景。部署在公网 VPS 的用户,推荐将终端模式改为 docker,隔离风险,守护服务器安全,修改后配置如下:
terminal: docker
首次交互,感受自动记忆与技能生成能力
完成部署与配置后,开启第一次对话,就能直观体验 Hermes 区别于传统 AI 工具的核心特性。在终端输入 hermes 启动程序,界面简洁直观,无需额外引导,直接输入内容即可开启交流。
每一轮对话结束后,系统会自动将交互内容存入内置的 SQLite 数据库,并通过 FTS5 建立全文索引。区别于全量加载历史记录的模式,Hermes 会根据当前对话话题,按需检索相关历史片段,既控制了上下文长度、保证响应速度,也实现了跨会话的记忆留存。我们可以通过命令查看程序目录结构,直观看到数据存储文件:
# 查看 Hermes 根目录文件
ls ~/.hermes/
# 查看自动生成的技能目录
ls ~/.hermes/skills/
简单的自我介绍、使用习惯描述,都会被系统精准记录,下次对话时无需重复交代背景信息。
随着对话深入,当执行代码转换、文件处理这类重复性较强的复杂任务时,框架会自动提炼执行流程,生成独立的 Markdown 格式技能文件,存放至专属技能目录。后续再次发起同类需求,Agent 会直接调用已生成的技能完成工作,不再重复摸索执行逻辑。如果对输出结果提出修改意见,系统不仅会修正当前内容,还会同步更新对应的技能文档,逐步优化执行规则,形成持续迭代的使用闭环。整个过程无需手动编写规则文件,自动化流程让工具越用越贴合个人使用习惯。
多平台网关接入,实现全终端协同使用
Hermes 搭载统一的消息网关模块,支持十余种主流社交与办公平台接入,所有终端共享同一套记忆、技能与配置,真正做到一处使用、多端联动。
Telegram 是移动端接入的首选平台,配置流程简单高效。在平台内找到官方机器人账号 @BotFather,发送 /newbot 按指引创建专属 Bot,获取格式类似 123456789:ABCdefGhIJKlmNoPQRsTUVwxyz 的 Token。将 Token 填入 config.yaml 完成绑定,完整配置参考如下:
model:
provider: openrouter
api_key: sk-or-xxxxx
model: anthropic/claude-sonnet-4
terminal: local
gateway:
telegram:
token: "你的Telegram Bot Token"
保存配置后重启 Hermes 服务,即可在手机端和机器人交互。手机端不仅可以发送文字指令,语音消息也能自动转写处理,碎片化场景下使用十分便捷。依托 VPS 全天候运行的特性,即便关闭本地电脑,也能随时通过手机向 Agent 下发任务、查看结果。
面向团队协作场景,可接入 Discord、Slack 等平台。在对应开发者后台创建应用并获取 Bot Token 后,继续在配置文件中追加对应参数:
gateway:
telegram:
token: "你的Telegram Bot Token"
discord:
token: "你的Discord Bot Token"
slack:
token: "xoxb-你的Slack Bot Token"
Discord 适合技术团队内部沟通、代码协作,将机器人拉入群组后,全体成员都能调用 Agent 完成代码审查、信息汇总等工作;Slack 更适配企业办公环境,按照平台规则创建应用并配置权限,就能融入企业现有工作流。除此之外,框架还原生支持 WhatsApp、Signal,社区也拓展出钉钉、飞书等国内常用办公平台适配方案,覆盖个人与团队的多样化使用需求。
跨平台对话连续性是网关设计的一大亮点。在手机 Telegram 上发起调研任务,切换到电脑终端可以继续跟进进度,Discord 群组中讨论的技术方案,在 Slack 内也能正常调取历史上下文。所有交互数据统一存储,不会因为终端切换出现信息断层。同时结合定时任务功能,还能设置自动推送简报、汇总工作内容等规则,让 Agent 主动完成周期性工作。
自定义技能编写,灵活拓展专属能力
除了系统自动生成技能,Hermes 也支持手动创建、编辑技能,使用者可以根据业务需求定制专属执行规则,进一步强化工具能力。框架沿用通用的技能标准,技能文件以 Markdown 格式编写,上手门槛极低,所有自定义技能统一存放在 ~/.hermes/skills/ 目录下。
我们可以通过终端命令新建技能文件,以规范 Git 提交信息的技能为例:
# 新建自定义技能文件
touch ~/.hermes/skills/git-commit-style.md
打开文件写入规则内容,一份完整的技能文档可以包含标题、触发条件、行为规则、实操示例等内容。精准描述触发场景,能让 Agent 在对应需求出现时自动匹配技能;详细的步骤规则与约束要求,统一任务执行标准;搭配真实的输入输出示例,进一步规范执行逻辑。编写完成后无需重启服务,技能即时生效。
社区技能库也是能力拓展的重要渠道。直接向 Agent 发送指令,即可查询、安装社区共享的成熟技能,一键部署立即生效。所有安装后的社区技能都支持二次编辑,使用者可以基于通用模板修改细节,适配自身工作场景。同时框架支持跨工具技能迁移,在同标准其他 AI 工具中积累的技能文件,直接复制到 ~/.hermes/skills/ 目录,简单调整后就能直接在 Hermes 中使用,过往的技能资产可以无缝复用。
日常使用中也有对应的调试技巧。对话中输入指令即可查看当前已加载的技能列表,判断目标技能是否正常触发;也可以通过命令查看本地日志文件,追溯技能匹配、执行的全过程,排查冲突与异常。
# 查看技能相关日志
cat ~/.hermes/logs/hermes.log
当多个技能触发条件重叠时,系统会优先匹配契合度更高的内容,若出现执行偏差,可通过调整触发规则、精简技能内容来优化。
MCP 协议集成,打通全品类外部工具生态
依托 Model Context Protocol(MCP)开放协议,Hermes 能够连接六千余款外部应用与服务,打破原生工具的能力边界,无缝融入个人与团队的现有工具栈。
MCP 相当于 AI 工具领域的通用接口,分为 stdio 和 HTTP 两种连接方式。本地数据库、本地文件类工具优先使用 stdio 模式,以子进程形式运行,通信速度快且无需额外网络开销;云端服务、多团队共享工具则选择 HTTP 长连接模式,适配远程调用场景。两种模式仅需在 config.yaml 中补充对应参数,无需开发额外适配代码,即可完成对接。
GitHub 是最常用的 MCP 集成场景,前往 GitHub 开发者设置页面生成个人访问令牌后,在配置文件中添加 MCP 服务:
mcp_servers:
github:
command: "npx"
args: ["-y", "@modelcontextprotocol/server-github"]
env:
GITHUB_PERSONAL_ACCESS_TOKEN: "你的GitHub Token"
接入完成后,Agent 能够实现仓库查询、Issue 创建、代码审查、PR 管理等全套操作,用自然语言就能完成仓库运维工作。
对接 PostgreSQL 数据库的配置示例如下,可根据自身数据库账号、地址修改连接字符串。出于安全考量,对接数据库时建议使用只读账号,规避数据误修改风险。
mcp_servers:
postgres:
command: "npx"
args: ["-y", "@modelcontextprotocol/server-postgres"]
env:
POSTGRES_CONNECTION_STRING: "postgresql://user:pass@localhost:5432/mydb"
框架支持精细化的工具权限管理,针对每一个 MCP 服务,都可以手动限定可调用的工具列表,遵循最小权限原则。以下示例仅开放 GitHub 部分常用工具,屏蔽高危操作:
mcp_servers:
github:
command: "npx"
args: ["-y", "@modelcontextprotocol/server-github"]
env:
GITHUB_PERSONAL_ACCESS_TOKEN: "你的GitHub Token"
allowed_tools:
- list_issues
- create_issue
- get_pull_request
- create_pull_request_review
实际使用中可以循序渐进接入外部服务,先部署高频工具熟悉流程,再根据需求逐步增加,避免工具过多导致决策效率下降。
原生工具、自定义技能与 MCP 外部服务可以形成高效组合。MCP 负责对接外部应用获取数据与能力,技能文件定义标准化的使用流程,原生工具完成本地调度与执行。三者相互配合,能够搭建出自动化工作流,从数据获取、流程处理到结果输出全链路自主运行,充分释放 Hermes Agent 的自动化潜力。
更多推荐


所有评论(0)