白话大模型增强技术系列之Agent Skills
Agent Skills的核心底座确实就是一个存放prompt的md文件,里面的name/description相当于这份文件的唯一标识,LLM通过判别用户输入和description的匹配度,实现skill文件定位和调用。在此之上,我们还可以添加各类附属脚本和资源文件,让它能调用脚本,变成更加复杂的可执行的自动化工具
系列文章目录
白话大模型增强技术系列之LLM速通
白话大模型增强技术系列之概览篇
白话大模型增强技术系列之Prompt Engineering
白话大模型增强技术系列之Agent
白话大模型增强技术系列之Agent Skills
一、Agent Skills 是什么?
核心形式:Markdown 文件
本质:AI处理特定任务的“说明书”
定义:是将专业知识、工作流规范固化为可复用资产的技术或开放标准
Skill 的核心结构:
一个文件夹 + 一个 SKILL.md 文件
一个 Skill 本质上就是一个 Markdown 文件
目录结构:
skills/
└── my-skill/
├── SKILL.md # 必需:元数据+指令
├── scripts/ # 可选:可执行代码
├── references/ # 可选:文档资料
└── assets/ # 可选:模板、资源
基本模板
由两部分组成:
- 元数据(名字/功能描述,告诉AI这个skill是用来干啥任务的,被两个“
---”包起来) - 指令(执行该类任务时“干活细则”,告诉AI怎么具体做)
示例:做一个针对“csv数据生图”任务的skill:
---
name: data to chart
description: 分析 CSV/Excel 数据并生成可视化图表
---
# 数据分析和可视化
## 使用场景
- 格式转换(CSV ↔ Excel ↔ JSON)
- 生成可视化图表
## 数据分析
- 描述性统计、分组聚合、数据透视
- 相关性分析
## 数据可视化
- 使用 `matplotlib` 或 `seaborn` 生成图表
- 保存为 PNG/SVG 格式
看到这应该有懂王跳出来了:就这?这不就是把prompt以markdown的格式保存在指定目录里吗?
我想说:确实,但不仅如此,还有更牛逼的。Agent Skills的核心底座确实就是一个存放prompt的md文件,里面的name/description相当于这份文件的唯一标识id,LLM通过判别用户输入和id的匹配度,实现skill文件定位和调用。在此之上,我们还可以添加各类附属脚本和资源文件,让它能调用脚本,变成更加复杂的可执行的自动化工具,这是不是和mcp的思想有点像🤔🤔。
具体解决了什么
| 问题 | Skills 方案 |
|---|---|
| 重复教 AI | 自动匹配场景,无需手动输入长 prompt |
| 知识分散 | Git 版本化管理,团队统一使用 |
| 上下文爆炸 | 渐进式加载,只读需要的部分 |
| 跨工具迁移 | 同一套 Skill 用于 Claude、Copilot、Cursor |
省流两个字:复用。复用就意味着不用重复造轮子,省事儿。
1.场景复用:针对特定的场景,不用每次都写一遍prompt然后再调整,把写好的prompt和脚本都写到SKILL.md然后保存下来,每次遇到同样场景或任务自动触发调用。
2.平台复用:同一套skill可以跨平台或者说跨工具迁移复用,意思就是不管用什么工具,你写的skill我也能用。如果需要实现某个功能,就先去skill市场上看看有没有,有的话直接拿来用。
Agent Skills最初由Anthropic推出,说实话这名字取得,挺容易和Agent搞混的😷😷。在2025年的12月18日,Anthropic正式将其发布为开放标准。这时候Agent Skills就不再只是Claude独有的技术了,而是一套标准,短短三个月不到的时间,其他大模型厂商就陆续跟进了这套标准,现在Cursor/Trae/Coze/Copilot/Manus等等大模型工具都已具备Skills的功能。
二、Agent Skills 工作原理
基本流程
- 发现(Discovery):AI 工具先读取所有技能的元数据(name 和 description),判断任务是否相关,这些元数据始终在系统提示中。
- 激活(Activation):当任务匹配某个技能的描述时,LLM才把完整的 SKILL.md 指令读入上下文。
- 执行(Execution):LLM根据按照指令执行,配按需加载参考文件或调用AI工具运行代码。
需要注意的是,在Agent Skills的架构中,用户并不是和大模型直接交互的,中间一定有一个工具来存储我们的skill文件、协调任务的处理,这里的工具可以是Claude、copilot、cursor等等。在最终请求时,工具会把所需的信息和原本的用户输入合并成新的prompt,然后再发送给LLM,这一点是不是又有点像RAG🤔🤔。
渐进式披露架构
Agent Skills采用的是渐进式披露架构,这又是啥玩意?😓。
渐进式披露,说白了就是我需要什么再拿什么,我不需要就不拿。
- 发现阶段:咱只需要拿所有skill的元数据,因为触不触发还不一定呢,有可能今天咱就压根用不到skill呢,把所有内容都加载岂不是浪费了。
- 激活阶段:既然激活了某个任务,那我也先只加载核心指令SKILL.md,其他的文件均不加载。
- 执行阶段:如果md正文里说,我需要时读取额外的某个文件(如脚本、示例)时,我再去读指定文件,否则不加载。
这样的渐进式架构能很好的节省token费用和提升效率,如果我们不管有没有触发特定任务,每次都将skill文件夹里的内容输入给AI,会造成大量的浪费,无关的上下文token也会影响任务本身的执行结果。
Prompt 工程的工程
如果你已经很了解RAG/MCP/Prompt工程等这些技术的话,你一定会跟我有同感,总感觉Agent Skills和这些“前辈”技术似乎有点像。在我看来,Agent Skills是用RAG和MCP的思想将Prompt工程进行了工程化。听起来有点复杂,让我们娓娓道来:
Prompt工程的遗留问题
| 问题 | 说明 |
|---|---|
| 一次性 | 每次对话重新输入,无法沉淀 |
| 难维护 | 版本混乱,改一处,处处改 |
| 无权限 | 只能"说",不能"做"(执行脚本) |
如果说Prompt工程解决了怎么把Prompt 写好,Skills则解决了怎么把Prompt 用好:怎么把已经写好的Prompt工程进行存储、调用、版本管理,我称之为Prompt 工程的工程。
用MCP思想实现调用:MCP就是利用LLM自身的能力去判断用户指令是否需要调用相应的接口,Skills用description作为标识,让LLM判断是否需要调用对应的skill.md文件。更进一步,通过读取文件中的指令,判别是否需要调用脚本来执行。
用RAG思想实现拼接:RAG通过引入外部信息和原本的用户输入拼接,再输入大模型,让模型拥有挂载知识库的能力。Skills则通过中间工具让模型挂载了一个Prompt库(或者说是“任务说明书“库),通过将所需的Prompt与原本的用户输入做拼接,再输入大模型。
不得不说,Agent Skills的设计真的有点东西,把各种“前辈”技术的设计思想都利用了起来,这让其拥有更加广泛的应用场景,在实现某些功能时,相比用langchain搭建一个agent项目要轻便很多。但是它也有很大的局限性,其中一点就是你必须先有一个AI工具,比如Claude code、Cursor、Copilot,在这些工具上我们才能构建skill,对普通人来说是有一定门槛的。Agent Skills并不能完全替代像MCP/RAG这样的“前辈”技术,我们更应该将其当成一个大模型增强技术体系的补充,通过灵活组合这些技术,更好的满足用户的需求。
三、Skills在Copilot上的实践(拿来主义:三分钟搞定)
鄙人条件有限没有Claude,咱用Copilot来实操一下,实际上试下来基本一样。秉持不重复造轮子的原则,我们这次不自己写了,直接拿skill市场中现成的一个:agent-browser,这个skill的主要功能就是浏览网页。
1)安装skill
###在根目录或项目目录执行
npx skills add https://github.com/vercel-labs/agent-browser --skill agent-browser
然后它会让你选一个工具,这里可以看到skill生态已经相当庞大了,支持的工具已经达到几十种,这里我们选GitHub Copilot。
然后一路下一步就完事了,最后你会看到你的目录下生成了相关文件,其中SKILL.md是核心文件,其他是可以调用的脚本和资源文件。
为了确保这个skill被成功加载,可以在copilot聊天窗口输入指令”我现在有哪些Agent skills”来确认是否安装完成,如果没有则用重启大法,重启vscode。
2)使用
在chat窗口输入用户指令
使用 agent-browser Skill,帮我模拟浏览器访问 https://example.com,列出该网页的标题、核心内容,以及页面上的所有按钮元素
我们可以看到,agent-browser被调用然后一路各种执行,整体的完成率还是可以的。

四、Agent Skills相关资源整理
本文对Agent Skills的研究只是蜻蜓点水,若要系统深入学习请参考如下链接:
| 资源说明 | 链接 |
|---|---|
| Skill 聚合入口 | https://skills.sh/ |
| Skills 市场(中文界面) | https://skillsmp.com/zh |
| Agent Skills 官方标准站点 | https://agentskills.io |
| Anthropic 官方工程文章(Agent Skills 实战理念) | https://www.anthropic.com/engineering/equipping-agents-for-the-real-world-with-agent-skills |
| VS Code Copilot Agent Skills 文档 | https://code.visualstudio.com/docs/copilot/customization/agent-skills |
| Anthropic 官方 Skills GitHub 仓库 | https://github.com/anthropics/skills |
| Claude 技能精选列表(Awesome 系列) | https://github.com/ComposioHQ/awesome-claude-skills |
| 软件开发自动化工作流 Skills 集合 | https://github.com/obra/superpowers |
| 自动生成 Skill 的 Skill(官方示例) | https://github.com/anthropics/skills/tree/main/skills/skill-creator |
更多推荐

所有评论(0)