白话大模型增强技术系列之Agent Skills

Agent Skills的核心底座确实就是一个存放prompt的md文件，里面的name/description相当于这份文件的唯一标识，LLM通过判别用户输入和description的匹配度，实现skill文件定位和调用。在此之上，我们还可以添加各类附属脚本和资源文件，让它能调用脚本，变成更加复杂的可执行的自动化工具

D大调小步圆舞曲

563人浏览 · 2026-02-27 10:10:36

D大调小步圆舞曲 · 2026-02-27 10:10:36 发布

系列文章目录

白话大模型增强技术系列之LLM速通
 白话大模型增强技术系列之概览篇
 白话大模型增强技术系列之Prompt Engineering
白话大模型增强技术系列之Agent
白话大模型增强技术系列之Agent Skills

一、Agent Skills 是什么？

核心形式：Markdown 文件
本质：AI处理特定任务的“说明书”
定义：是将专业知识、工作流规范固化为可复用资产的技术或开放标准

Skill 的核心结构：
一个文件夹 + 一个 SKILL.md 文件
一个 Skill 本质上就是一个 Markdown 文件

目录结构：

skills/
	└── my-skill/
		 ├── SKILL.md      # 必需：元数据+指令
		 ├── scripts/      # 可选：可执行代码
		 ├── references/   # 可选：文档资料
		 └── assets/       # 可选：模板、资源

基本模板
由两部分组成：

元数据（名字/功能描述，告诉AI这个skill是用来干啥任务的，被两个“---”包起来）
指令（执行该类任务时“干活细则”，告诉AI怎么具体做）

示例：做一个针对“csv数据生图”任务的skill：

---
name: data to chart
description: 分析 CSV/Excel 数据并生成可视化图表
---

# 数据分析和可视化

## 使用场景
- 格式转换（CSV ↔ Excel ↔ JSON）
- 生成可视化图表

## 数据分析
- 描述性统计、分组聚合、数据透视
- 相关性分析

## 数据可视化
- 使用 `matplotlib` 或 `seaborn` 生成图表
- 保存为 PNG/SVG 格式

看到这应该有懂王跳出来了：就这？这不就是把prompt以markdown的格式保存在指定目录里吗？
我想说：确实，但不仅如此，还有更牛逼的。Agent Skills的核心底座确实就是一个存放prompt的md文件，里面的name/description相当于这份文件的唯一标识id，LLM通过判别用户输入和id的匹配度，实现skill文件定位和调用。在此之上，我们还可以添加各类附属脚本和资源文件，让它能调用脚本，变成更加复杂的可执行的自动化工具，这是不是和mcp的思想有点像🤔🤔。

具体解决了什么

问题	Skills 方案
重复教 AI	自动匹配场景，无需手动输入长 prompt
知识分散	Git 版本化管理，团队统一使用
上下文爆炸	渐进式加载，只读需要的部分
跨工具迁移	同一套 Skill 用于 Claude、Copilot、Cursor

省流两个字：复用。复用就意味着不用重复造轮子，省事儿。
1.场景复用：针对特定的场景，不用每次都写一遍prompt然后再调整，把写好的prompt和脚本都写到SKILL.md然后保存下来，每次遇到同样场景或任务自动触发调用。
2.平台复用：同一套skill可以跨平台或者说跨工具迁移复用，意思就是不管用什么工具，你写的skill我也能用。如果需要实现某个功能，就先去skill市场上看看有没有，有的话直接拿来用。

Agent Skills最初由Anthropic推出，说实话这名字取得，挺容易和Agent搞混的😷😷。在2025年的12月18日，Anthropic正式将其发布为开放标准。这时候Agent Skills就不再只是Claude独有的技术了，而是一套标准，短短三个月不到的时间，其他大模型厂商就陆续跟进了这套标准，现在Cursor/Trae/Coze/Copilot/Manus等等大模型工具都已具备Skills的功能。

二、Agent Skills 工作原理

基本流程

发现（Discovery）：AI 工具先读取所有技能的元数据（name 和 description），判断任务是否相关，这些元数据始终在系统提示中。
激活（Activation）：当任务匹配某个技能的描述时，LLM才把完整的 SKILL.md 指令读入上下文。
执行（Execution）：LLM根据按照指令执行，配按需加载参考文件或调用AI工具运行代码。

需要注意的是，在Agent Skills的架构中，用户并不是和大模型直接交互的，中间一定有一个工具来存储我们的skill文件、协调任务的处理，这里的工具可以是Claude、copilot、cursor等等。在最终请求时，工具会把所需的信息和原本的用户输入合并成新的prompt，然后再发送给LLM，这一点是不是又有点像RAG🤔🤔。

渐进式披露架构

Agent Skills采用的是渐进式披露架构，这又是啥玩意？😓。
渐进式披露，说白了就是我需要什么再拿什么，我不需要就不拿。

发现阶段：咱只需要拿所有skill的元数据，因为触不触发还不一定呢，有可能今天咱就压根用不到skill呢，把所有内容都加载岂不是浪费了。
激活阶段：既然激活了某个任务，那我也先只加载核心指令SKILL.md，其他的文件均不加载。
执行阶段：如果md正文里说，我需要时读取额外的某个文件（如脚本、示例）时，我再去读指定文件，否则不加载。

这样的渐进式架构能很好的节省token费用和提升效率，如果我们不管有没有触发特定任务，每次都将skill文件夹里的内容输入给AI，会造成大量的浪费，无关的上下文token也会影响任务本身的执行结果。

Prompt 工程的工程

如果你已经很了解RAG/MCP/Prompt工程等这些技术的话，你一定会跟我有同感，总感觉Agent Skills和这些“前辈”技术似乎有点像。在我看来，Agent Skills是用RAG和MCP的思想将Prompt工程进行了工程化。听起来有点复杂，让我们娓娓道来：

Prompt工程的遗留问题

问题	说明
一次性	每次对话重新输入，无法沉淀
难维护	版本混乱，改一处，处处改
无权限	只能"说"，不能"做"（执行脚本）

如果说Prompt工程解决了怎么把Prompt 写好，Skills则解决了怎么把Prompt 用好：怎么把已经写好的Prompt工程进行存储、调用、版本管理，我称之为Prompt 工程的工程。

用MCP思想实现调用：MCP就是利用LLM自身的能力去判断用户指令是否需要调用相应的接口，Skills用description作为标识，让LLM判断是否需要调用对应的skill.md文件。更进一步，通过读取文件中的指令，判别是否需要调用脚本来执行。
用RAG思想实现拼接：RAG通过引入外部信息和原本的用户输入拼接，再输入大模型，让模型拥有挂载知识库的能力。Skills则通过中间工具让模型挂载了一个Prompt库（或者说是“任务说明书“库），通过将所需的Prompt与原本的用户输入做拼接，再输入大模型。

不得不说，Agent Skills的设计真的有点东西，把各种“前辈”技术的设计思想都利用了起来，这让其拥有更加广泛的应用场景，在实现某些功能时，相比用langchain搭建一个agent项目要轻便很多。但是它也有很大的局限性，其中一点就是你必须先有一个AI工具，比如Claude code、Cursor、Copilot，在这些工具上我们才能构建skill，对普通人来说是有一定门槛的。Agent Skills并不能完全替代像MCP/RAG这样的“前辈”技术，我们更应该将其当成一个大模型增强技术体系的补充，通过灵活组合这些技术，更好的满足用户的需求。

三、Skills在Copilot上的实践（拿来主义：三分钟搞定）

鄙人条件有限没有Claude，咱用Copilot来实操一下，实际上试下来基本一样。秉持不重复造轮子的原则，我们这次不自己写了，直接拿skill市场中现成的一个：agent-browser，这个skill的主要功能就是浏览网页。

1）安装skill

###在根目录或项目目录执行
npx skills add https://github.com/vercel-labs/agent-browser --skill agent-browser

然后它会让你选一个工具，这里可以看到skill生态已经相当庞大了，支持的工具已经达到几十种，这里我们选GitHub Copilot。
在这里插入图片描述
然后一路下一步就完事了，最后你会看到你的目录下生成了相关文件，其中SKILL.md是核心文件，其他是可以调用的脚本和资源文件。
请添加图片描述
为了确保这个skill被成功加载，可以在copilot聊天窗口输入指令”我现在有哪些Agent skills”来确认是否安装完成，如果没有则用重启大法，重启vscode。

2）使用
在chat窗口输入用户指令

使用 agent-browser Skill，帮我模拟浏览器访问 https://example.com，列出该网页的标题、核心内容，以及页面上的所有按钮元素

我们可以看到，agent-browser被调用然后一路各种执行，整体的完成率还是可以的。
请添加图片描述

四、Agent Skills相关资源整理

本文对Agent Skills的研究只是蜻蜓点水，若要系统深入学习请参考如下链接：

资源说明	链接
Skill 聚合入口	https://skills.sh/
Skills 市场（中文界面）	https://skillsmp.com/zh
Agent Skills 官方标准站点	https://agentskills.io
Anthropic 官方工程文章（Agent Skills 实战理念）	https://www.anthropic.com/engineering/equipping-agents-for-the-real-world-with-agent-skills
VS Code Copilot Agent Skills 文档	https://code.visualstudio.com/docs/copilot/customization/agent-skills
Anthropic 官方 Skills GitHub 仓库	https://github.com/anthropics/skills
Claude 技能精选列表（Awesome 系列）	https://github.com/ComposioHQ/awesome-claude-skills
软件开发自动化工作流 Skills 集合	https://github.com/obra/superpowers
自动生成 Skill 的 Skill（官方示例）	https://github.com/anthropics/skills/tree/main/skills/skill-creator