Agent智能体从概念到实践(二)--- 什么是Skill
Skill(技能)可以理解为AI智能体的“工作手册”或“SOP(标准作业程序)”。它通过一个标准化的文件夹,把特定领域的专业知识、操作流程和最佳实践打包起来。Agent在执行相关任务时,可以随时翻阅这本手册,按步骤操作,而不用每次都从头教起。
如果说LLM是“大脑”,Tool是“手和脚”,那么Skill就是告诉大脑如何指挥手脚去完成特定任务的“说明书”。
🤔 为什么需要Skill?
原因很简单:大模型虽然聪明,但不了解你团队的内部规范和特定领域的专业知识。每次都要从头解释,不仅低效,结果也不稳定。
Skill就像一份“入职指南”或“操作手册”,解决了这个问题。它把特定知识固化下来,Agent需要时直接查阅,从而确保任务执行的准确性、一致性和高效率。
🆚 Skill与Tool、MCP的区别
为了更清楚地理解,我们可以用一个比喻来区分这三个核心概念:
-
MCP (模型上下文协议):万能插座。它定义了Agent连接外部工具的标准。
-
Tool (工具):具体的工具。它是执行单一、基础动作的“原子能力”,比如“发送邮件”、“查询数据库”。
-
Skill (技能):操作手册或SOP。它告诉Agent如何使用一系列工具、按照什么流程和标准来完成一个复杂的任务。
| 概念 | 核心问题 | 类比 | 作用 |
|---|---|---|---|
| MCP | 如何连接? | 万能插座 | 定义工具接入的标准接口 |
| Tool | 能做什么? | 具体工具 (锤子、螺丝刀) | 提供执行单一动作的基础能力 |
| Skill | 如何做? | 操作手册 (SOP) | 封装完成复杂任务的流程、知识与最佳实践 |
⚙️ Skill的工作原理:渐进式披露
Skill的核心设计理念是渐进式披露。Agent不会一次性加载所有内容,而是分三步按需加载:
-
发现 (Discovery):启动时,只加载所有Skill的名称和描述。这就像看到书的目录,成本极低,只占用约50个Token。
-
激活 (Activation):当任务与某个Skill描述匹配时,Agent才加载其核心文件
SKILL.md。 -
执行 (Execution):在执行
SKILL.md的指令时,如果遇到需要参考的文档或脚本,才会进一步加载。
这种机制让Agent可以“掌握”成百上千个Skill,而不会让上下文窗口(Context Window)过载。
📁 Skill的标准结构
一个标准的Skill是一个文件夹,通常包含以下部分:
-
SKILL.md(必需):核心指令文件,包含元数据(Meta-data)和正文。-
元数据:主要是
name(名称)和description(描述),用于“发现”阶段。 -
正文:具体的操作步骤、规则、条件分支等。
-
-
scripts/(可选):存放可执行的脚本,如Python或Shell脚本。 -
references/(可选):存放详细的参考文档,仅在需要时加载。 -
assets/(可选):存放图片、模板等静态资源。
✍️ 如何创建一个Skill?
以创建一个“会议总结助手 (meeting-summarizer)”Skill为例,步骤如下:
-
创建文件夹:在指定目录(如
.claude/skills/)下创建文件夹meeting-summarizer。 -
编写
SKILL.md:在文件夹内创建SKILL.md文件,内容如下:--- name: meeting-summarizer description: 将会议内容总结为结构化要点:参会人员、议题、决定。 --- # 会议总结指令 请将用户提供的会议内容,严格按照以下格式总结: 1. **参会人员**:列出所有参会者。 2. **议题**:概括讨论的核心议题。 3. **决定**:列出会议最终做出的所有决定。 -
使用:之后,当Agent遇到会议记录时,就会自动加载并使用这个Skill来格式化输出。
💡 Skill的高级用法
为了让Skill更智能和强大,可以利用其高级特性:
-
引用 (Reference):在
SKILL.md中引用references/文件夹里的文档(如公司财务制度),并设定触发条件。只有当用户问题涉及财务时,Agent才会加载该文档,实现精准的按需调用。 -
脚本 (Script):在
SKILL.md中指示Agent在特定步骤执行scripts/文件夹里的脚本(如Python脚本),从而让Skill不仅能“建议”,还能真正“动手”完成任务。
更多推荐

所有评论(0)