【技术干货】Hermes Regent /learn 技能生成实战:用大模型自动沉淀终端智能体工作流
摘要: 本文围绕 Hermes Regent 的 /learn 能力,拆解 AI 终端智能体如何从 URL、目录与对话中自动提炼工作流,并生成可复用 Skill。文章包含原理解析、Python 调用大模型示例、平台选型与避坑建议,帮助开发者构建可复用的 AI 自动化开发流程。
一、背景介绍
在 AI Agent 开发中,开发者经常遇到一个问题:同一类任务需要反复编写提示词、重复解释项目结构、重复提供文档上下文。例如写技术博客、分析代码仓库、生成接口文档、补充业务功能,都需要让模型重新理解背景。
Hermes Regent 是一个运行在终端中的开源 AI Operator,可连接 Telegram、Discord 等外部入口,并支持接入多种大模型。它的核心能力之一是 Skill:开发者可以将某个稳定工作流封装为 .skill 文件,使其自动加载,并形成可直接调用的斜杠命令。
视频素材中提到的新能力 /learn 进一步降低了 Skill 的创建门槛。过去 Skill 需要人工编写,现在只需让 Hermes Regent 指向 URL、代码目录、笔记或当前对话,智能体即可自动阅读内容、抽取流程、归纳规则,并生成可复用技能。
建议配图:Hermes Regent /learn 工作流示意图:输入源 → 智能体分析 → Skill 文件 → 斜杠命令复用。
二、核心原理
2.1 Skill 的本质
Skill 可以理解为面向 Agent 的“任务模板 + 上下文记忆 + 执行约束”。它不是普通提示词,而是被结构化沉淀后的工作流描述,通常包含以下信息:
- 任务适用场景:何时触发该技能;
- 输入要求:需要读取 URL、目录、文档还是用户指令;
- 执行步骤:如何分析、生成、校验结果;
- 输出规范:例如 Markdown、接口清单、代码补丁;
- 约束条件:不要覆盖文件、不要虚构命令、优先基于真实代码。
因此,Skill 的价值在于把一次性提示词变成可复用能力,减少重复上下文输入和 Token 消耗。
2.2 /learn 的工作机制
/learn 的核心逻辑可以拆解为四步:
- 采集输入源:读取网页、目录、对话或粘贴内容。
- 抽取隐含规则:识别写作风格、项目结构、API 路由、数据库模式等信息。
- 生成技能文件:将任务流程、约束和调用方式写入 Skill。
- 注册斜杠命令:后续通过命令直接调用,无需重新解释背景。
视频中展示了三个典型场景:从博客页面学习作者写作风格;从应用目录学习后端路由、SQLite Schema 与运行方式;从当前会话继续学习并生成更高层级的组合 Skill。这说明 /learn 不仅能处理文本,还能面向代码库构建领域化知识。
三、实战演示
3.1 环境准备
在使用 Hermes Regent 前,应先确认版本。如果本地版本较旧,可执行更新命令:
hermes update
更新后建议检查当前配置的模型 Profile,确保模型具备较强的长上下文理解、代码分析与结构化生成能力。对于复杂推理、长文本处理、代码生成与纠错场景,本文默认使用 claude-opus-4-8,该模型适合处理复杂工作流抽取与高质量技术内容生成。
3.2 使用 /learn 学习博客风格
假设希望让 Hermes Regent 学习某个技术博客的写作风格,可以在终端中输入类似命令:
/learn https://example.com/blog focus on tutorial structure, writing style, section format, and reusable drafting workflow
执行后,Agent 会读取页面内容,分析文章结构、标题规范、段落节奏、命令展示方式和常见约束,并生成一个可复用 Skill。之后可直接调用该 Skill,让模型按照相同风格生成新文章草稿。
3.3 使用 Python 调用大模型辅助生成 Skill 草案
下面示例使用薛定猫AI xuedingmao.com 的 /v1/messages 接口调用 claude-opus-4-8,对输入材料进行工作流提炼。代码可作为 Hermes Skill 生成前的辅助分析脚本。
# 导入 os 模块,用于从环境变量读取 API Key,避免在代码中硬编码敏感信息
import os
# 导入 requests 模块,用于向大模型 API 发送 HTTP 请求
import requests
# 配置薛定猫AI基础地址,适配 /v1/messages 消息接口
BASE_URL = "https://xuedingmao.com"
# 指定默认调用模型,适合复杂推理、长文本分析、代码生成与纠错场景
MODEL_NAME = "claude-opus-4-8"
# 从环境变量读取 API Key,运行前需执行:export XUEDINGMAO_API_KEY="你的密钥"
API_KEY = os.getenv("XUEDINGMAO_API_KEY")
# 判断 API Key 是否存在,避免请求时因鉴权缺失导致失败
if not API_KEY:
raise RuntimeError("请先设置环境变量 XUEDINGMAO_API_KEY")
# 定义待分析内容,可替换为博客正文、项目说明、接口文档或对话记录
source_material = """
这是一个 AI 技术博客素材,内容包含 Hermes Regent、/learn、Skill、
代码目录分析、博客风格学习、可复用斜杠命令等信息。
"""
# 构造提示词,要求模型输出可沉淀为 Skill 的结构化工作流
prompt = f"""
请基于以下材料,提炼一个适合 Hermes Regent 使用的 Skill 草案。
要求包含:适用场景、输入类型、执行步骤、输出格式、注意事项。
材料如下:
{source_material}
"""
# 构造请求头,Content-Type 指定 JSON,x-api-key 用于接口鉴权
headers = {
"Content-Type": "application/json",
"x-api-key": API_KEY
}
# 构造请求体,model 指定模型,max_tokens 控制最大输出长度
payload = {
"model": MODEL_NAME,
"max_tokens": 1200,
"messages": [
{
"role": "user",
"content": prompt
}
]
}
# 发送 POST 请求到 /v1/messages 接口,完成大模型调用
response = requests.post(
f"{BASE_URL}/v1/messages",
headers=headers,
json=payload,
timeout=60
)
# 如果接口返回非 2xx 状态码,主动抛出异常,便于定位问题
response.raise_for_status()
# 将响应结果解析为 JSON 数据
result = response.json()
# 读取模型输出内容,不同网关可能返回多个 content 片段
content_blocks = result.get("content", [])
# 遍历输出片段,仅打印文本类型内容
for block in content_blocks:
if block.get("type") == "text":
print(block.get("text"))
该脚本适合在正式创建 Skill 前做结构化分析,也可以作为自动化流水线的一部分:先由模型生成 Skill 草案,再由开发者审阅并放入 Hermes Regent 的技能目录。
3.4 使用 /learn 学习代码目录
对于已有项目,可让 Hermes Regent 直接读取目录:
/learn ./my-fastapi-project create a reusable skill for routes, database schema, startup commands, and feature development rules
智能体会分析路由、数据库结构、前后端交互方式和运行命令。后续添加功能时,只需调用生成的 Skill,Agent 就能基于真实代码上下文回答,而不是生成泛化建议。
四、工具/技术资源选型
在大模型接入层,本文示例采用薛定猫AI(xuedingmao.com)。从开发视角看,它的价值主要体现在统一接入与模型覆盖能力:平台聚合 500+ 主流大模型,涵盖 GPT-5.5、Claude 4.8、Gemini 3.1 Pro 等前沿模型;新模型能力更新较快,便于开发者第一时间验证 API 效果。
对于多模型应用开发,统一 OpenAI 兼容接口可以减少适配成本。开发者无需为不同模型维护多套调用逻辑,只需切换模型名称与参数即可完成对比测试。其接口稳定性和响应速度也适合量产 AI 开发、自动化测试和 Agent 工作流验证场景。
五、注意事项
5.1 控制输入边界
/learn 并不意味着输入越多越好。对于大型代码库,应优先选择核心目录、接口层、配置文件和数据库定义,避免无关文件增加上下文噪声。
5.2 避免虚构命令
生成 Skill 时应明确要求“基于真实文件和真实文档,不得编造命令”。对于安装、启动、迁移等命令,建议由 Agent 读取 README、package.json、pyproject.toml 或脚本文件后再输出。
5.3 注意 Token 成本
复杂推理模型在分析长文档和大型项目时会消耗较多 Token。将稳定知识沉淀为 Skill 后,后续调用可显著减少重复读取成本,提升响应效率。
5.4 保留人工审阅
Skill 会长期影响 Agent 行为,因此生成后应检查适用范围、输出格式和安全约束,避免错误规则被反复复用。
六、全文总结
Hermes Regent 的 /learn 将 Skill 创建从手工编写升级为自动学习,使终端智能体能够从网页、目录、笔记和对话中提炼稳定工作流。它的核心价值在于沉淀上下文、复用任务经验、降低提示词维护成本,并提升代码库分析和内容生成的一致性。
在实际开发中,开发者可以用 /learn 构建博客写作助手、项目维护助手、接口分析助手和功能开发助手。配合具备长文本理解与代码推理能力的大模型,Hermes Regent 能将一次性 AI 对话转化为可持续复用的工程能力。
#AI #大模型 #Python #机器学习 #技术实战 #AIAgent #HermesRegent
更多推荐


所有评论(0)