提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档


前言

在做 AI 应用/智能体(Agent)工程时,你很快会发现一个现实问题:同一个“写报告/生成 PDF/改 Word/做表格”的需求,模型有时能做得很好,有时又会跑偏。原因通常不是“模型不行”,而是缺少一套稳定、可复用、可执行的操作规范。

skills(技能/操作规程)就是用来解决这个问题的:把某类任务的“标准做法、工具用法、质量检查、输出规范”写成一份可复用的说明,让模型在需要时按这份说明执行,从而把结果稳定下来。


一、skills 是什么?

1. 定义:可复用的任务 SOP(Standard Operating Procedure)

在工程语境里,skill 通常不是“模型内置技能”,而是一份外置的流程文档/规范文本,内容类似:

  • 这类任务的目标是什么(输出什么)
  • 允许用哪些工具(例如 python-docx、reportlab、openpyxl)
  • 必须按什么步骤做(先解析输入→再生成→再校验→导出)
  • 输出格式/命名/排版规则是什么
  • 常见坑与质量自检清单是什么

你可以把它理解为:把“怎么做”写死,把“做得好不好”写清。

2. skills 解决什么问题

  • 稳定性:同类任务每次输出一致(减少“看心情”的发挥)

  • 可复现:别人按同一套步骤也能复现结果

  • 可控性:哪些工具可用、哪些不能用、边界在哪里

  • 可扩展:新增一种交付物,只要新增一个 skill 文档即可

3. 模型是怎么“调用” skill 的

  • 路由/编排器注入(最常见):系统检测到用户要“做 PDF/做表格”,就把对应 skill 文本注入到本轮上下文,模型按说明执行。
  • Agent 自主选择:模型先规划需要哪类 skill,然后通过检索/加载机制拿到 skill 文本,再执行。

不管哪种方式,本质都是:
skill 内容被放进模型上下文,模型按这套规范做事,而不是模型“凭空记住所有流程”。

4. 一个好 skill 的典型编排

  1. 适用范围(什么时候用/什么时候不用)

  2. 输入要求(需要什么信息/文件)

  3. 工具与约束(允许调用哪些工具、禁止事项)

  4. 标准工作流(编号步骤,尽量像“菜谱”)

  5. 输出规范(格式、命名、结构、样式)

  6. QA 自检清单(交付前必须检查的点)

  7. 示例(最小例子 + 常见变体)

二、使用步骤(从 0 到 1 落地)

下面以 “在系统里引入 skills 并稳定产出”为目标,整理一套通用的落地步骤。

第 1 步:定义任务边界与交付物

先把“要做什么”说清楚,避免 skill 写成万能说明书。

  • 交付物类型:Word / PDF / Excel / PPT / 代码 / 报告
  • 必要内容:必须包含哪些章节/字段/表格
  • 不做什么:哪些内容不在范围(例如不做 OCR、不做联网检索等)

例:“把用户提供的字段生成一份 2 页 PDF 报价单,含封面、目录、表格、页码,字体/边距固定。”

第 2 步:选择工具链并写清约束

把工具写死,减少模型临场发挥:

  • 文档:python-docx
  • PDF:reportlab
  • 表格:openpyxl
  • 图片/图表:明确生成方式(matplotlib 等)

同时写明约束:

  • 不允许使用的工具/方式
  • 文件大小、页数上限、耗时上限(如有)
  • 输出命名规范、保存路径规范(如你的系统有固定目录)

第 3 步:把流程写成“不可歧义的步骤”

这一步决定稳定性。建议:

  • 用编号步骤(1、2、3…)
  • 每一步都写输入/动作/产出
  • 关键参数写成默认值(字体字号、页边距、列宽、表格样式)

技巧:把“尽量美观”改成可执行规则,比如“标题 16pt 加粗、正文 10.5pt、行距 1.25、表头灰底”。

第 4 步:加入 QA 自检清单(门禁)

让模型生成后必须过“自检”,否则容易出现低级错误。

常见 QA 点:

  • 页码/目录是否正确
  • 表格是否越界、是否断行难看
  • 字体是否统一、中文是否乱码
  • 文件是否可打开、链接是否有效
  • 关键字段是否缺失(金额、日期、版本号等)

第 5 步:接入路由(什么时候触发哪个 skill)

常见触发方式:

  • 关键词/意图分类:用户说“导出 PDF/生成报价单/做 Excel”,触发对应 skill
  • 结构化输入:用户提供了某种 schema(字段齐全),就进入“自动生成”流程
  • 多段对话:当信息收集完毕后,再触发 skill 进入执行阶段

这一步的关键是:触发条件要明确,避免误触发(比如聊天闲聊时不要加载“生成 PDF”技能)。

第 6 步:版本化与迭代

skills 一定要版本化,否则越改越乱:

  • v1:先跑通最小闭环(能交付)
  • v1.1:补 QA、补默认值、补失败处理
  • v2:支持更多变体(多语言、横版、模板切换)

建议每次迭代只改一个点,并记录:

  • 改动原因
  • 对输出的影响
  • 是否兼容旧输入

总结

skills 的本质,是把“某类任务的最佳实践”固化成可复用、可执行、可验收的 SOP,让模型不再靠临场发挥,而是按流程稳定交付。

Logo

小龙虾开发者社区是 CSDN 旗下专注 OpenClaw 生态的官方阵地,聚焦技能开发、插件实践与部署教程,为开发者提供可直接落地的方案、工具与交流平台,助力高效构建与落地 AI 应用

更多推荐