Anthropic 工程师用了几百个 Skills，总结出这 9 条血泪经验

Anthropic 工程师 Thariq 分享数百个内部 Skills 的实战经验：9种分类、Gotchas优先、description是触发器、给Claude代码而非文字指令。

石臻臻的杂货铺

1341人浏览 · 2026-03-18 10:03:54

石臻臻的杂货铺 · 2026-03-18 10:03:54 发布

Anthropic 内部在用数百个 Claude Code Skills，Thariq 这篇文章把他们踩过的坑、总结出的套路全写出来了。不是官方文档那种平铺直叙，是真正用过之后的经验。

Claude Code 的 Skills 功能火了很久，但大多数人只停在"会用"这一层。会写一个 SKILL.md、会把它放到 .claude/skills 目录——然后就没了。

Anthropic 内部用了数百个 Skills，工程师 Thariq 最近把这段经验写成了长文。读下来，跟自己摸索的那套有挺多不一样的地方。

这篇文章提炼了其中我觉得最有价值的部分，同时把原文里所有案例都保留下来了。

Thariq 关于 Claude Code Skills 的深度分享

Skills 不是 Markdown 文件，是文件夹

这是理解 Skills 的第一个关键转变。

很多人觉得 Skill 就是写一个 SKILL.md 文件，告诉 Claude 要做什么。Thariq 说，这是最常见的误解。Skills 是文件夹，不是文件。文件夹里可以放脚本、资产文件、引用文档、配置……整个文件系统都是上下文工程的一部分。

把 Skills 当文件夹来设计，而不是当 Markdown 来写——这个思路一变，能做到的事完全不同。

举个例子：如果你的 Skill 最终要输出一个 Markdown 报告，可以在 assets/ 目录里放一个模板文件，让 Claude 直接复制和填充，而不是让它凭空生成格式。如果有函数签名和使用示例，可以单独放到 references/api.md，需要的时候 Claude 自己去读。

这叫"渐进式披露"（progressive disclosure）——告诉 Claude 有哪些文件，它会在合适的时机去读，而不是一次全部塞进上下文里。

9 类 Skills，逐一拆解

Thariq 团队把内部所有 Skills 梳理归类，发现基本上能分成 9 类。最有意思的地方是，不少工程师写了一堆 Skills，但只覆盖了其中 2-3 类——有些场景根本没想到可以用 Skill 来解决。

Claude Code Skills 的 9 大分类图

① 知识 / 参考类（Knowledge & Reference）

告诉 Claude 如何正确使用内部库、CLI 或 SDK。适合内部库，也适合 Claude 经常用错的外部库。这类 Skill 通常包含一个参考代码片段目录，以及一份 Claude 写这类代码时要主动避开的坑列表。

原文案例：

billing-lib — 内部计费库的边界情况、各种 footgun
internal-platform-cli — 内部 CLI 的每个子命令，附带"什么时候用哪个"的示例
frontend-design — 让 Claude 更好地理解你的设计系统

② 验证类（Verification）

描述如何测试或验证代码是否正确。通常搭配 Playwright、tmux 等外部工具做实际验证。Thariq 专门强调：让工程师花一周时间把验证 Skills 做好，是值得的投资。可以考虑让 Claude 录制操作视频，或者在每一步用断言验证程序状态——这些都可以通过 Skill 里的脚本来实现。

原文案例：

signup-flow-driver — 自动跑注册 → 邮箱验证 → onboarding 全流程，每步断言状态
checkout-verifier — 用 Stripe 测试卡驱动结账 UI，验证发票状态
tmux-cli-driver — 专门用于需要 TTY 的交互式 CLI 测试

③ 数据访问类（Data Access）

连接数据和监控系统。通常包含带凭证的数据获取库、仪表盘 ID 等，以及常见查询工作流说明。

原文案例：

funnel-query — “我该 join 哪些事件才能看到注册→激活→付费的路径”，附带真实的 user_id 表
cohort-compare — 比较两个用户群的留存率或转化率，标记统计显著差异，链接到分群定义
grafana — 数据源 UID、集群名称、"症状 → 对应仪表盘"查找表

④ 自动化工作流类（Automation）

把重复操作压缩成一条命令。指令通常比较简单，但可能依赖其他 Skills 或 MCP。Thariq 提示：把每次执行的结果存进日志文件，能帮模型在多次执行之间保持一致性，也方便它反思"上次干了什么"。

原文案例：

standup-post — 汇总工单系统、GitHub 活动、前一天 Slack 内容，生成格式化日报，只写增量变化
create-<ticket-system>-ticket — 执行字段 schema 校验（有效枚举值、必填字段），附带创建后工作流（通知审查人、同步 Slack）
weekly-recap — 已合并 PR + 已关闭工单 + 部署记录 → 格式化周报

⑤ 脚手架类（Scaffolding）

为代码库的特定模块生成框架样板。这类 Skill 特别适合当你的脚手架里有自然语言要求、无法完全用代码表达的时候，可以配合可组合脚本一起用。

原文案例：

new-<framework>-workflow — 带注解的新服务/工作流/处理器脚手架
new-migration — 数据库迁移文件模板，附带常见踩坑提示
create-app — 预置好认证、日志、部署配置的内部应用模板

⑥ 代码审查类（Code Review）

执行代码质量检查。可以包含确定性脚本或工具以保证可靠性，也可以放到 Git Hook 或 GitHub Action 里自动触发。

原文案例：

adversarial-review — 起一个独立子 agent 专门批评，实施修复，反复迭代直到问题只剩小细节
code-style — 强制代码风格，尤其是 Claude 默认不会做好的那些
testing-practices — 描述如何写测试、测什么

⑦ 部署类（Deploy）

拉取、推送、部署代码。这类 Skill 可能会引用其他 Skills 来收集数据。

原文案例：

babysit-pr — 监控 PR → 重试 flaky CI → 解决合并冲突 → 开启自动合并
deploy-<service> — 构建 → 冒烟测试 → 灰度流量切换（持续对比错误率）→ 回归时自动回滚
cherry-pick-prod — 独立 worktree → cherry-pick → 冲突处理 → 按模板提 PR

⑧ 调试类（Debugging）

接收症状（比如 Slack 消息、告警、错误签名），走一遍多工具调查流程，输出结构化排查报告。

原文案例：

<service>-debugging — 针对你们流量最高的服务，把"症状 → 工具 → 查询模式"全部映射出来
oncall-runner — 拉取告警 → 排查常见嫌疑 → 整理发现
log-correlator — 给一个 request ID，从所有可能经手的系统里拉取对应日志

⑨ 运维类（Operations）

执行例行维护和操作流程，尤其是涉及破坏性操作的场景——加上防护步骤，让工程师在关键操作上更容易遵守最佳实践。

原文案例：

<resource>-orphans — 找出孤立的 pod/volume → 发到 Slack → 冷却期 → 用户确认 → 级联清理
dependency-management — 你们组织的依赖审批流程
cost-investigation — “为什么存储/流量费用突然暴涨”，附带具体的 bucket 和查询模式

Skills 分类全览

对照这 9 类，检查一下自己有没有盲点——很多人只写了知识类和脚手架类，验证类和运维类往往是最值钱但最容易被忽略的。

Gotchas 是 Skill 里含金量最高的部分

写 Skill 时怎么做才最有价值？Thariq 给了几个具体建议，其中最直接的一条：Gotchas 段落是整个 Skill 里信号最强的内容。

Gotchas 示例截图

Gotchas 应该从 Claude 在使用这个 Skill 时真正踩过的坑里积累。每次遇到新的失败模式，就更新进去。

这背后的逻辑是：Claude Code 对代码库和通用编程已经知道很多了，如果你的 Skill 主要是重复它已经知道的东西，价值有限。真正有用的是把 Claude 的默认行为推到你的方向——不管是设计品味、组织规范，还是特定的边界情况。

Thariq 举了一个 Anthropic 内部的"设计品味 Skill"的例子：一个工程师通过反复和客户迭代，让 Claude 避免常见的设计陋习（比如 Inter 字体加紫色渐变），形成了一套独到的设计偏好库。

设计品味 Skill 示例

指令别写死，给 Claude 留空间

这个点有点反直觉。我们写 Skill 的本能是"写得越详细越好"，但 Thariq 说恰恰相反——Skills 复用率很高，太具体的指令反而会让它在边缘情况下变死板。

给 Claude 它需要的信息，但留足灵活度去适应具体情境。下面两张图直接对比了过于具体 vs 恰当灵活的写法：

指令过于具体的反例

灵活指令的正确写法

比较典型的场景是需要用户输入的 Skill。比如一个发日报到 Slack 的 Skill，你可能需要先问用户发到哪个频道。做法是把这些配置存到 config.json 文件里——如果配置不存在，Claude 就问用户；如果已有配置，直接用。如果要呈现结构化多选题，可以指示 Claude 使用 AskUserQuestion 工具。

config.json 配置模式示例