AI Agent Skills（智能体技能）完整详解

Esaka_Forever

145人浏览 · 2026-06-19 21:18:11

Esaka_Forever · 2026-06-19 21:18:11 发布

AI Agent Skills（智能体技能）完整详解

一、核心定义

AI Agent Skills 是面向大模型智能体、模块化封装的标准化业务能力包，也是你之前看的 Assembling Context 流程图里的核心分层组件。简单概括：把一类完整业务任务的触发规则、分步流程、工具调用顺序、校验标准、异常兜底、行业规范全部打包，让 AI 在匹配用户需求时自动加载、按固定流程闭环完成任务，不再自由发挥、漏步骤、乱调用工具。它是区分普通聊天 LLM 和Agentic Coding（自主编程智能体，Cline/Cursor/Claude Code） 的核心设计。

核心定位

三、Skill vs Tools 本质区分（高频混淆点）

表格

对比维度	AI Agent Skills（技能）	Tools（工具）
层级	上层业务流程、专业 SOP	底层原子执行函数
作用	定义「怎么完整做好一件事」	定义「单一基础操作」
执行逻辑	自动编排多工具、循环、重试、校验闭环	单次孤立调用，无流程逻辑
载体	`Skill.md` 文件夹（流程 + 文档 + 脚本）	JSON 函数定义、接口签名
编程场景示例	「完整接口单元测试生成」Skill	ReadFile、npm test、WriteFile 三个 Tool
Token 开销	懒加载，仅匹配时载入详情	全量 schema 常驻上下文，开销更高

通俗类比：

四、标准 Skill.md 文件结构（编程智能体通用规范）

最简可用模板（Cline/Cursor 原生支持）

---
# YAML元数据（常驻上下文，用于意图匹配）
name: ts-api-refactor
description: 重构TypeScript后端接口，统一参数校验、添加JWT鉴权、生成接口文档
allowed-tools: ReadFile WriteFile Terminal Git
version: 1.0
---
# TypeScript接口重构完整流程
## 执行步骤
1. 读取目标路由文件与全局鉴权中间件
2. 批量补全入参zod校验逻辑
3. 新增JWT权限拦截代码
4. 自动生成Swagger接口注释
5. 运行tsc类型校验，报错则自动修复
6. 输出全部变更Diff，等待用户确认保存
## 约束规则
- 禁止删除原有业务逻辑，仅新增/修改校验层
- 所有变更必须展示对比，不静默写入文件

完整工程目录结构（复杂技能）

plaintext

skill-refactor-api/
├── SKILL.md          # 核心：元数据+完整执行流程
├── scripts/          # 辅助自动化脚本（仅需要时加载）
│   └── zod-template.ts
├── references/       # 团队代码规范、模板文档
└── assets/           # 接口注释模板文件

五、在 Coding Agent（Cline/Cursor）里的核心价值

结合你之前学习的 Progressive Closure（渐进收敛） 工作流，Skills 是实现自主编程闭环的核心载体：

六、上下文组装对应关系（匹配你那张流程图）

流程图分层从上至下：System Prompt → Skills → Tools → Codebase → User Convo

七、行业主流落地产品

八、优缺点总结

优势

短板

Tool（工具）= 底层原子动作（读文件、跑终端、搜网页）
Skill（技能）= 上层复合业务流程，编排多个 Tool 完成一件完整事
Agent（智能体）= 调度大脑，识别意图并匹配对应 Skill 执行
二、Skill 三层标准架构（Progressive Disclosure 渐进加载，解决 Token 膨胀）

为避免一次性加载所有技能耗尽上下文窗口，行业统一采用三段式懒加载机制，对应图中标注的 20,000 tokens 总容量：
元数据层 Metadata（常驻上下文，极低 Token）每个 Skill 仅加载 name、description 一两行简介，全部技能常驻系统提示词，用来做意图匹配路由。
yaml
```
---
name: generate-unit-test
description: 读取源码生成配套单元测试，自动安装依赖并执行校验
allowed-tools: ReadFile WriteFile Terminal
---
```
指令层 Instructions（触发后动态载入）用户需求匹配该技能时，才把完整执行步骤、业务规则载入上下文，包含分步操作、输出格式、校验标准。
资源层 Resources（按需延迟加载）脚本、参考规范、模板文件，仅在指令流程明确需要时才读取，不占用基础上下文。
Tool = 手术刀、镊子、止血钳（单个工具）
Skill = 标准外科缝合手术流程（规定什么时候用哪把工具、步骤、校验伤口、处理出血）
稳定标准化输出，消除 AI 随机发挥无 Skill 时 AI 写代码步骤混乱、漏测试、不校验；加载 Skill 后强制按固定工程规范执行。
大幅降低用户指令复杂度你只需说「重构用户接口」，Agent 自动匹配 ts-api-refactor Skill，自主走完读代码→改逻辑→校验→自测全流程，不用你分步指挥。
可控权限，安全防误操作Skill 元数据可配置 allowed-tools，限制该技能仅能调用指定工具，禁止删除文件、强制变更人工确认。
模块化可复用、可插拔新增业务能力仅需新建一份 Skill 文件夹，无需重写全局 System Prompt；多项目、多账号可共享 Skill 库。
配合渐进式收敛闭环Skill 内置循环校验、报错重试逻辑，支撑多轮迭代，直到任务全部验证通过才收口（Closure）。
Skills 层：批量加载所有 Skill 的元数据简介（合计 20k tokens），作为智能体能力清单；
收到用户编码需求后，Agent 路由匹配对应 Skill；
动态载入该 Skill 完整流程指令，再调度下方 Tools 读写代码库、执行终端；
结合 Codebase 项目代码、历史对话 User Convo 完成完整任务迭代。
Cline / Cursor / Claude Code：原生 Skill.md 文件夹规范，Agentic Coding 标杆；
LangGraph / AutoGPT：兼容 Skill 封装标准，通用通用多场景智能体；
Gemini Code Assist：预览版 Skill 能力，谷歌云开发场景专用；
OpenAI Agent SDK：配套 Skill 封装机制，企业自动化流程开发。
大幅提升复杂长任务稳定性，解决大模型 “健忘、步骤遗漏” 问题；
懒加载机制控制上下文 Token 消耗，适配 250k + 超大代码库；
业务流程沉淀可复用，团队工程规范直接固化给 AI；
权限、校验、异常兜底内置，降低代码误删、越权操作风险。
高质量 Skill 编写有学习成本，需要梳理完整业务 SOP；
技能库过多时，元数据会占用基础上下文，小幅提升基础 Token 开销；
简单单行代码补全场景，轻量 Continue/Copilot 反而更轻量化高效。

龙虾开发者社区

小龙虾开发者社区是 CSDN 旗下专注 OpenClaw 生态的官方阵地，聚焦技能开发、插件实践与部署教程，为开发者提供可直接落地的方案、工具与交流平台，助力高效构建与落地 AI 应用

更多推荐

AI Agent 的记忆存在哪？

龙虾开发者社区

搭建AI Agent

龙虾开发者社区

OpenClaw官网入口及最新版本更新日志

但问题是更新日志散落在各个地方，GitHub的Release页面、Discord公告、CHANGELOG文件，要看全了挺费劲的。SKILL.md文件是必须的，它描述了这个Skill的功能和触发条件，OpenClaw通过分析它来决定什么时候调用对应的Skill。如果你想了解新版本改了什么、有没有影响你的使用，去看GitHub的Releases页面，每个版本都有比较详细的release notes。虽