Skills 编写规范与经验指南

JackWillian

103人浏览 · 2026-07-04 21:02:00

JackWillian · 2026-07-04 21:02:00 发布

写在最前面：实际上，绝大部分的skill创作都可以通过安装skill-creator后，再和Agent对话跑完整个流程，直接要求Agent将整个流程处理成skill。

文章目录

1. Skill 是什么

一个 skill 是一个文件夹，里面至少有一个 SKILL.md。这个 SKILL.md 就是给模型（Claude / 其他 agent）看的说明书，告诉它：

什么时候应该调用这个 skill（触发条件）；
怎么做这项专门的任务（步骤、模板、脚本、检查清单）；
不该做什么（反模式、边界）。

Skill 与 prompt 的差别在于：prompt 是一次性输入，skill 是可复用、可版本化、可迭代评估的能力单元。它可以被打包为 .skill 文件、发布到 marketplace、被多个 agent 共享。

Skill 与 tool（工具）的差别在于：tool 是模型可以直接调用的动作接口；skill 是指导模型如何组合 tools 完成一类工作的知识包。一个 skill 里通常会自带若干脚本作为 “sub-tools”，但真正的价值在文档本身。

简言之：Skill = 一个装着 SKILL.md 的文件夹，用来把某项专门知识"装配"到模型上下文里。

2. Skill 的物理结构

官方推荐的最小与完整目录结构：

skill-name/                       # 目录名建议 kebab-case
├── SKILL.md                      # 必需：YAML frontmatter + Markdown 正文
├── LICENSE.txt                   # 强烈建议：非必需，用于公开发布时的免责与产权的声明
├── scripts/                      # 可选：可执行的确定性脚本（Python/Node/Bash）
│   ├── main_tool.py
│   └── utils.py
├── references/                   # 可选：按需加载的深度文档
│   ├── advanced.md
│   └── schemas.md
├── assets/                       # 可选：产物中直接使用的静态资源
│   ├── template.html
│   └── fonts/
├── examples/                     # 可选：范例、样例输入输出
│   └── sample-input.md
├── templates/                    # 可选：起始模板（如 HTML/JS 骨架）
├── agents/                       # 可选：子 agent 的 system prompt 片段
│   └── grader.md
└── requirements.txt              # 可选：Python 依赖清单

命名习惯（与上面目录树严格对应）：

目录 / 文件	用途	何时使用
`SKILL.md`	Skill 主入口，含 YAML frontmatter + Markdown 正文	必需
`LICENSE.txt`	完整 license 文本，供 frontmatter 中的 `license` 字段指向	非必需；公开发布时推荐随 skill 一起分发
`scripts/`	确定性代码，模型直接调用而不必读源码	有重复性/可自动化的步骤时
`references/`	长参考文档，模型「按需」读取	单个 SKILL.md 装不下、或按主题拆分时
`assets/`	出现在最终产物里的资源（字体、图标、模板）	需要打包到输出中
`examples/`	样例集（正/反例、模板问答）	类目繁多，SKILL.md 只做路由
`templates/`	起始骨架（HTML/JS/JSON schema 等）	输出遵循固定模板
`agents/`	子 agent 的 system prompt 片段	skill 会 spawn subagent 时
`requirements.txt`	Python 依赖清单（Node 项目对应 `package.json`）	scripts/ 里存在需外部依赖的脚本时

约定 1：文件夹名、name frontmatter 字段、marketplace 中注册的 skill 名，三者严格一致（如 pdf、docx、skill-creator）。

约定 2：把 skill 视为「一个可移植的最小单元」——不要在 SKILL.md 里引用文件夹外的路径。

3. 渐进披露 - Skill 的核心设计哲学

Skill 的加载分三级，写作时必须按这三级来切分内容：

层级	加载时机	大小预算	承担内容
L1 元数据（`name` + `description`）	永远在上下文中	~100 词	触发决策所需的最小信息
L2 SKILL.md 正文	skill 被触发后立刻加载	建议 <500 行	核心工作流、决策树、路由到附属文件的指针
L3 附属文件	模型按需 `Read`	无限	深度参考、模板、示例、可执行脚本

核心原则：L2 是路由，不是百科全书。当 SKILL.md 快要超过 500 行、或某一节篇幅过大时，就要把细节剥离到 references/ 或 examples/，SKILL.md 里只留一句「如果要做 X，请阅读 references/x.md」。

4. YAML Frontmatter 规范

SKILL.md 顶部必须以 --- 分隔的 YAML 块开始。规范字段如下：

4.1 必填字段

---
name: my-skill-name              # 唯一标识；kebab-case；与目录名一致
description: >
  一句/一段说明「这个 skill 做什么 + 什么时候应该被触发」。
  这是 skill 唯一的触发信号，务必写好。
---

4.2 可选字段

version: 语义化版本号            # 建议字段；当前各客户端尚未统一支持，但有助于团队内版本管理
license: Complete terms in LICENSE.txt   # 或 "Proprietary"
compatibility: ...                        # 依赖工具/环境（较少使用）

4.3 `description` —— 唯一的触发信号

模型是否加载这个 skill，几乎完全由 description 决定。因此这一字段既是"电梯陈述"，也是"路由规则"。

优质 description 的六个特征：

主动"推销"——skill 天然容易 undertrigger（模型不主动使用）。写法上略带"push"：

“Make sure to use this skill whenever the user mentions dashboards, data visualization, or wants to display any kind of company data — even if they don’t explicitly ask for a ‘dashboard.’”
列出触发词/触发场景——把用户可能说的短语列出来，例如 PRD / RFC / design doc / write a doc（doc-coauthoring）。
列出应当跳过的场景——用 Do NOT trigger when … 显式地划边界（xlsx、docx）。
包含 TRIGGER / SKIP 路由头——参考 claude-api：
```
TRIGGER — read BEFORE opening the target file …
SKIP only when another provider is being worked on …
```
这把 description 从"元数据"升级为"路由器"。
对创作型 skill：加版权提醒——algorithmic-art / canvas-design / brand-guidelines 都在 description 里加：

“Create original … rather than copying existing artists’ work to avoid copyright violations.”
保持"完整语境"——不要写 “Format PDF”，而写 “Fill out interactive PDF forms, extract text/tables from PDFs, redact content, or convert to images. Trigger whenever a .pdf file is mentioned.”

4.4 关于 name 的约束

全小写，用连字符分隔单词（kebab-case）。
不与其他 skill 冲突；建议先用 marketplace 检索。
与目录名严格一致；重命名时同步 .claude-plugin/marketplace.json。

5. SKILL.md 正文的常见骨架

正文没有强制结构，但仓库中反复出现的高价值骨架有以下几种模块，可按需拼装：

5.1 顶部 Quick Reference / 决策表

在正文开头放一张 任务 → 使用哪个方法/文件 的表格。docx、pptx、claude-api 等 skill 都用了这套。

## Quick Reference

| 任务 | 用什么 |
| --- | --- |
| 填写可交互 PDF 表单 | 阅读 `forms.md` |
| 从 PDF 中提取文本 | 使用 `pdfplumber` |
| 生成新 PDF | 使用 `reportlab` |

价值：模型进入 skill 后，第一眼就能路由到正确的子路径，而不必读完整个文档。

5.2 Overview / When to use

一段 3–5 行的自我介绍：这个 skill 干什么、适用什么场景、不适用什么场景。放在 Quick Reference 之下、正式流程之上。

5.3 Workflow / Process（阶段化流程）

复杂的 skill 用编号阶段拆分：

mcp-builder 用 4 个 Phase（Deep Research → Design → Implement → Evaluate）；
doc-coauthoring 用 3 个 Stage（Context Gathering → Refinement → Reader Testing）；
algorithmic-art 用 5 个大写阶段（ALGORITHMIC PHILOSOPHY CREATION → DEDUCING THE CONCEPTUAL SEED → …）。

每个阶段下要写清：目的、动作、检查点、进入下一阶段的准入条件。

5.4 Common Pitfalls / Anti-patterns

在 skill 末尾（或阶段内）显式列出过去失败过的写法。这一节的价值极高：

docx：14 条 “Critical Rules for docx-js”；
pptx：NEVER use accent lines under titles；
web-artifacts-builder：反 “AI slop”（避免居中布局、紫渐变、Inter 字体）；
webapp-testing：DO NOT read the source until you try running the script first。

5.5 QA / 自检 checklist

给出模型可对照打勾的 markdown checklist（xlsx 的 “Formula Verification Checklist”）。让 QA 变成可执行动作而不是抽象要求。

5.6 Reference Files 索引

在末尾列出所有 L3 附属文件与何时读取：

## Reference Files
- `references/schemas.md` — JSON 结构参考
- `agents/grader.md` — 判分子 agent 的 prompt

6. 六种常见 Skill 形态（模式库）

6.1 Router 型（超轻量路由器）

代表：internal-comms（32 行）
适用：一个大主题下有多个并列子领域，每个子领域独立成文。
结构：When to use → How to use（3 步：识别 → 加载 examples/xxx.md → 执行）→ Keywords。
优点：SKILL.md 极小，永远不会撑爆 L2 上下文。

6.2 Reference 型（长期查阅手册）

代表：claude-api（578 行）、brand-guidelines
适用：知识密集，模型会反复回来查阅。
结构：Quick Reference 表 → 分主题参考 → Common Pitfalls。
关键技巧：

description 中带 TRIGGER / SKIP 路由头；
支持"子命令"（如 /claude-api migrate）；
显式 pin 版本（“ALWAYS use claude-opus-4-8 — non-negotiable”）；
包含 API drift 表（stale vs current）。

6.3 Workflow 型（多阶段流程）

代表：skill-creator、mcp-builder、doc-coauthoring、webapp-testing
适用：任务需要多步骤、有明确产出物。
结构：分 Phase / Stage 编号；每阶段有目标、动作、退出条件。
关键技巧：

用 ASCII 决策树（webapp-testing）表达路径选择；
用"环境分支"处理有/无 subagent 场景（doc-coauthoring、pptx）；
用红队框架：“Assume there are problems. Your job is to find them.”（pptx）。

6.4 Creative / Philosophy 型（创作类）

代表：algorithmic-art、canvas-design、frontend-design
适用：输出是艺术/设计，需要模型有诠释空间。
结构：先写"创作理念"（4–6 段风格宣言），再写"执行细节"。
关键技巧：

Philosophy + Execution 两步法：先让模型写一份小型"艺术运动宣言"，再基于宣言生成产物；
明确 FIXED vs VARIABLE 部分（“模板结构不动，只替换算法/参数”）；
反 AI slop：显式列出模型的默认平庸倾向并禁用（frontend-design 的三种默认外观、web-artifacts-builder 的紫渐变+Inter）。

6.5 Human-in-the-loop 型（需要用户参与）

代表：theme-factory
适用：产出前必须由用户挑选/确认。
结构：4 步——向用户展示 showcase → 请用户选择 → 等待选择 → 应用选择。
关键技巧：把"等待用户"作为流程的合法节点，而不是"打断"。

6.6 Toolkit / Script-first 型（脚本包）

代表：slack-gif-creator、docx、pdf、pptx、xlsx
适用：任务本质是数据处理/文件生成，脚本比 prompt 更可靠。
结构：SKILL.md 说明何时调哪个脚本；具体逻辑在 scripts/。
关键技巧：

让脚本 --help 自解释；
明确要求"不要读脚本源码"（webapp-testing）以省 token；
提供"字段/颜色/格式"的固化规范（xlsx 的财务模型颜色约定：蓝=输入、黑=公式、绿=跨表、红=外部、黄=关键假设）。

7. 写作风格与 prompt 语言技巧

Skill 的正文本质是给模型看的 prompt。

7.1 祈使句 + 说明"为什么"

避免堆砌全大写 MUST / NEVER，而是解释这么做的原因。模型有 theory of mind，理解原理后能举一反三；纯命令则只在原例上生效。

反例：NEVER use requests library.
正例：Prefer httpx over requests because we need async support and requests is not maintained upstream.

只有在真的踩过多次坑、必须硬性阻止时，才使用 NEVER / ALWAYS 全大写形式。

7.2 ❌/✅ 对照示例

给出错误写法与正确写法并列（docx、xlsx、web-artifacts-builder 广泛使用）：

❌ WRONG:  `ws.cell(row=10, column=2).value = 15234.5`
✅ CORRECT: `ws.cell(row=10, column=2).value = "=SUM(B2:B9)"`

对照示例比抽象规则的 signal 强 5 倍。

7.3 “Read this file when X” 指针

L2 到 L3 的路由必须具体、条件化：

If you need to fill out a PDF form, read `forms.md` and follow its instructions.

避免：“see references for more info”（模糊、模型不会真的去读）。

7.4 STEP 0 强前置

对于容易被跳过的关键前提（读模板、跑 --help），显式立成 “STEP 0”：

### ⚠️ STEP 0: READ THE TEMPLATE FIRST ⚠️
Do not start coding until you have read `templates/base.html` in full.

7.5 环境分支

skill 可能运行在 Claude Code、Claude.ai、Cowork、其他 agent 环境中，用 If access to sub-agents is available: / If not: 显式分叉，避免模型走错路径。

7.6 反过度积极

有时需要"叫模型别做"：

web-artifacts-builder：“avoid testing the artifact upfront as it adds latency”
docx：“Do not write Python scripts — use the Edit tool directly”
webapp-testing：“DO NOT read the source until you try running the script first”

模型默认过度积极，显式的"少做"指令能省大量 token。

7.7 Tone 元指令

想控制模型对用户说话的语气，就写一节 Tips for Effective Guidance（doc-coauthoring）：

“Be direct and procedural. Don’t try to ‘sell’ the approach — just execute it.”

7.8 版本 pinning

对易漂移的字段（模型 ID、SDK 版本）明确 pin 值并说明"non-negotiable"。参考 claude-api。

7.9 关键词尾巴

在文末列一个 Keywords: 短列表（internal-comms、brand-guidelines），补充 description 中未覆盖的同义词/触发词。

8. 脚本、模板与资源目录的约定

8.1 scripts/ 的黄金规则

每个脚本都有 --help——模型第一步永远是 python scripts/foo.py --help。
默认黑箱调用，不读源码——脚本可能几百上千行，读进上下文会拖慢模型。SKILL.md 应显式说 “call as black-box; do not ingest source unless customization is required”。
脚本命名保持稳定——重命名等于破坏 skill 使用者的记忆。

在 SKILL.md 里给出可复制粘贴的完整命令：

python scripts/aggregate_benchmark.py <workspace>/iteration-N --skill-name <name>

依赖用 requirements.txt（Python）或 package.json（Node）声明。

8.2 references/ 的黄金规则

单文件超过 300 行时必须在文首放 TOC；
每个文件的开头写一句"什么时候读这个文件"；
交叉引用其他 references 时使用相对路径 references/xxx.md。

8.3 assets/ 的黄金规则

仅存放最终产物中直接使用的资源（模板、字体、图标）；
大二进制（字体、PDF）用 LFS 或子仓库。

8.4 templates/ 的黄金规则

明确 FIXED（不可改）与 VARIABLE（可替换）区域；
在 SKILL.md 中把这一区分写死。

9. Skill 的评估与迭代闭环

skill-creator 沉淀了一套完整的「写 → 测 → 评 → 改」的闭环，值得作为标准工作流引入你自己的 skill 项目：

9.1 触发（description）测试

从"用户是否会说这句话时期望被触发"角度，构造 20 条 query（一半 should-trigger、一半 should-not-trigger），near-miss 越多越有信息量。用 run_loop.py 迭代优化 description。

关键点：should_not_trigger 必须是"貌似相关但其实不该触发"，而不是显然无关的问题——否则测试没有 signal。

9.2 输出（内容）评估

对每个测试 prompt，同时跑：

with-skill：加载 skill 的版本；
baseline：不加载 skill（新 skill）或加载旧版（改进 skill）。

结果按 iteration-N/eval-K/{with_skill,without_skill}/outputs/ 组织。

9.3 断言（assertions）设计

每条测试 prompt 配套若干断言（grading.json 中的 expectations）：

命名要读得懂——"输出包含 SUM(B2:B9) 公式" 好过 "assertion_3"；
可编程校验的断言优先——写脚本判分而不是"眼球判分"；
主观类断言不要硬凑——设计/写作类交给人类打分。

9.4 Benchmark 聚合与查看

benchmark.json 的 schema（详见 skill-creator/references/schemas.md）字段名严格：configuration 必须是 "with_skill" 或 "without_skill"；pass_rate/time_seconds/tokens 必须嵌套在 result 下。

用 eval-viewer/generate_review.py 生成的 HTML 视图给人类看，让他填 feedback.json 做定性反馈。

9.5 迭代规则

从反馈里泛化——不要只修 3 个测试例，要理解背后共通的失败模式；
保持 prompt 精简——如果一段话没贡献信号，删掉；
解释"为什么"——见 §7.1；
横向发现重复劳动——如果 3 次运行都独立写了同一个脚本，把它内置到 scripts/。

9.6 打包发布

python scripts/package_skill.py <path/to/skill-folder>

产出 .skill 文件（本质是 zip）。marketplace 通过 .claude-plugin/marketplace.json 注册。

10. 新手 30 分钟上手流程（Quick Start）

如果你是第一次写 skill，按下面顺序做，30 分钟内可跑通闭环：

步骤 1（3 分钟）：确定 skill 形态

对照 §6，问自己三个问题：

有多少子领域？ 多 → Router 型；少 → Workflow 型。
是流程还是查阅？ 流程 → Workflow；查阅 → Reference。
是创作还是确定性？ 创作 → Philosophy；确定性 → Toolkit。

步骤 2（5 分钟）：新建目录 + 复制模板

mkdir -p my-skill
cp template/SKILL.md my-skill/SKILL.md
cp LICENSE.txt my-skill/LICENSE.txt   # 如需

步骤 3（10 分钟）：写 SKILL.md

按下面骨架填空：

---
name: my-skill
description: >
  【一句话说做什么】。Trigger whenever 【触发条件A】、【触发条件B】、
  or 【触发条件C】. Do NOT trigger when 【排除条件】.
license: Complete terms in LICENSE.txt
---

# My Skill

## Overview
【3–5 行自我介绍】

## Quick Reference
| 任务 | 使用 |
| --- | --- |
| ... | ... |

## Workflow
### Step 1: 【动作】
### Step 2: 【动作】

## Common Pitfalls
- ❌ ...
- ✅ ...

## Reference Files
- `references/xxx.md` — 何时读它

步骤 4（5 分钟）：写 2–3 条测试 prompt

{
  "skill_name": "my-skill",
  "evals": [
    {"id": 1, "prompt": "真实用户会说的话1", "expected_output": "…"},
    {"id": 2, "prompt": "真实用户会说的话2", "expected_output": "…"}
  ]
}

步骤 5（5 分钟）：跑一次 with_skill vs without_skill

用 skill-creator 提供的脚本或手动 spawn 两个子任务。看两组输出的差别，决定：

如果 with_skill 明显更好 → 进入迭代；
如果几乎一样 → skill 没提供信号，回炉重写；
如果 with_skill 更差 → skill 在误导模型，找出误导点。

步骤 6（2 分钟）：写下改进方向

在 skill 目录旁开一个 NOTES.md，记录本轮观察 + 下一版打算改哪里。进入下一轮迭代。

11. 常见反模式（Anti-Patterns）

反模式	症状	修法
Description 过短或抽象	Skill 从不被触发	加触发词、场景、“push” 语气；参考 §4.3
一切写在 SKILL.md	文件超过 800 行，模型加载后仍找不到重点	拆到 `references/`，SKILL.md 只留路由
MUST/NEVER 泛滥	模型死板、无法泛化到新场景	改为"因为 X，所以 Y"；参考 §7.1
抽象指令	“Format properly”、“Handle appropriately”	换成具体步骤 + ❌/✅ 例子
没有 Common Pitfalls	常见坑反复被踩	补一节反模式清单
触发关键词太宽	过度触发、抢占其他 skill	加 `Do NOT trigger when …`
脚本不带 --help	模型强行读源码，浪费 context	加 argparse + 明确文档
在 skill 之间硬编码路径	打包/移植失败	只使用 skill 内相对路径

12. 参考内容

龙虾开发者社区

小龙虾开发者社区是 CSDN 旗下专注 OpenClaw 生态的官方阵地，聚焦技能开发、插件实践与部署教程，为开发者提供可直接落地的方案、工具与交流平台，助力高效构建与落地 AI 应用

更多推荐

[智能体-644]：OpenClaw的自动编程、代码评审、gitee仓库管理与专用的编程智能体的对比

若你的核心诉求是维护OpenClaw 数字人公司自身资产、写配套自动化小脚本、轻量化仓库版本管理，内置能力完全够用，无需额外搭建专用编程智能体；若存在大规模软件研发、严格代码质量管控、复杂工程迭代需求，OpenClaw 内置能力存在明显短板，必须搭配独立专用编程智能体形成互补；二者底层共享同一套 Gitee Git 协同逻辑，可以基于远程仓库打通数据，实现 “硅基数字组织底座 + 专业编码研发智能

龙虾开发者社区

【数字体验设计实战】09：企业级UX战略——从巨头AI路径洞察到下一代交互与协作

企业级UX战略：从AI路径到下一代交互设计本文探讨了企业级数字体验设计的战略视角，通过对比三星与苹果的AI发展路径，揭示了技术投入与用户体验之间的不对等关系。核心观点包括：体验价值优先：苹果通过整合成熟AI技术并聚焦场景化体验，比三星的全栈自研取得了更好的用户感知效果。交互范式革新：以谷歌"圈选搜索"为例，展示了情境式AI如何通过无跳转交互降低用户认知负荷，实现"AI主动适应用户"的下一代交

龙虾开发者社区

从20-40K的Agent后端JD，聊聊普通人怎么转型AI开发岗？

龙虾开发者社区

所有评论(0)

查看更多评论

JackWillian

@qq_43160985

已为社区贡献1条内容

Skills 编写规范与经验指南

JackWillian

文章目录

1. Skill 是什么

2. Skill 的物理结构

3. 渐进披露 - Skill 的核心设计哲学

4. YAML Frontmatter 规范

4.1 必填字段

4.2 可选字段

4.3 description —— 唯一的触发信号

4.4 关于 name 的约束

5. SKILL.md 正文的常见骨架

5.1 顶部 Quick Reference / 决策表

5.2 Overview / When to use

5.3 Workflow / Process（阶段化流程）

5.4 Common Pitfalls / Anti-patterns

5.5 QA / 自检 checklist

5.6 Reference Files 索引

6. 六种常见 Skill 形态（模式库）

6.1 Router 型（超轻量路由器）

6.2 Reference 型（长期查阅手册）

6.3 Workflow 型（多阶段流程）

6.4 Creative / Philosophy 型（创作类）

6.5 Human-in-the-loop 型（需要用户参与）

6.6 Toolkit / Script-first 型（脚本包）

7. 写作风格与 prompt 语言技巧

7.1 祈使句 + 说明"为什么"

7.2 ❌/✅ 对照示例

7.3 “Read this file when X” 指针

7.4 STEP 0 强前置

7.5 环境分支

7.6 反过度积极

7.7 Tone 元指令

7.8 版本 pinning

7.9 关键词尾巴

8. 脚本、模板与资源目录的约定

8.1 scripts/ 的黄金规则

8.2 references/ 的黄金规则

8.3 assets/ 的黄金规则

8.4 templates/ 的黄金规则

9. Skill 的评估与迭代闭环

9.1 触发（description）测试

9.2 输出（内容）评估

9.3 断言（assertions）设计

9.4 Benchmark 聚合与查看

9.5 迭代规则

9.6 打包发布

10. 新手 30 分钟上手流程（Quick Start）

步骤 1（3 分钟）：确定 skill 形态

步骤 2（5 分钟）：新建目录 + 复制模板

步骤 3（10 分钟）：写 SKILL.md

步骤 4（5 分钟）：写 2–3 条测试 prompt

步骤 5（5 分钟）：跑一次 with_skill vs without_skill

步骤 6（2 分钟）：写下改进方向

11. 常见反模式（Anti-Patterns）

12. 参考内容

所有评论(0)

温馨提示：您尚未绑定手机号

JackWillian

4.3 `description` —— 唯一的触发信号