系列文章目录

白话大模型增强技术系列之LLM速通
白话大模型增强技术系列之概览篇
白话大模型增强技术系列之Prompt Engineering
白话大模型增强技术系列之Agent
白话大模型增强技术系列之Agent Skills


一、Agent Skills 是什么?

核心形式:Markdown 文件
本质:AI处理特定任务的“说明书”
定义:是将专业知识、工作流规范固化为可复用资产的技术或开放标准

Skill 的核心结构
一个文件夹 + 一个 SKILL.md 文件
一个 Skill 本质上就是一个 Markdown 文件

目录结构

skills/
	└── my-skill/
		 ├── SKILL.md      # 必需:元数据+指令
		 ├── scripts/      # 可选:可执行代码
		 ├── references/   # 可选:文档资料
		 └── assets/       # 可选:模板、资源

基本模板
由两部分组成:

  • 元数据(名字/功能描述,告诉AI这个skill是用来干啥任务的,被两个“---”包起来)
  • 指令(执行该类任务时“干活细则”,告诉AI怎么具体做)

示例:做一个针对“csv数据生图”任务的skill:

---
name: data to chart
description: 分析 CSV/Excel 数据并生成可视化图表
---

# 数据分析和可视化

## 使用场景
- 格式转换(CSV ↔ Excel ↔ JSON)
- 生成可视化图表

## 数据分析
- 描述性统计、分组聚合、数据透视
- 相关性分析

## 数据可视化
- 使用 `matplotlib` 或 `seaborn` 生成图表
- 保存为 PNG/SVG 格式

看到这应该有懂王跳出来了:就这?这不就是把prompt以markdown的格式保存在指定目录里吗
我想说:确实,但不仅如此,还有更牛逼的。Agent Skills的核心底座确实就是一个存放prompt的md文件,里面的name/description相当于这份文件的唯一标识id,LLM通过判别用户输入和id的匹配度,实现skill文件定位和调用。在此之上,我们还可以添加各类附属脚本和资源文件,让它能调用脚本,变成更加复杂的可执行的自动化工具,这是不是和mcp的思想有点像🤔🤔。

具体解决了什么

问题 Skills 方案
重复教 AI 自动匹配场景,无需手动输入长 prompt
知识分散 Git 版本化管理,团队统一使用
上下文爆炸 渐进式加载,只读需要的部分
跨工具迁移 同一套 Skill 用于 Claude、Copilot、Cursor

省流两个字:复用。复用就意味着不用重复造轮子,省事儿。
1.场景复用:针对特定的场景,不用每次都写一遍prompt然后再调整,把写好的prompt和脚本都写到SKILL.md然后保存下来,每次遇到同样场景或任务自动触发调用。
2.平台复用:同一套skill可以跨平台或者说跨工具迁移复用,意思就是不管用什么工具,你写的skill我也能用。如果需要实现某个功能,就先去skill市场上看看有没有,有的话直接拿来用。

Agent Skills最初由Anthropic推出,说实话这名字取得,挺容易和Agent搞混的😷😷。在2025年的12月18日,Anthropic正式将其发布为开放标准。这时候Agent Skills就不再只是Claude独有的技术了,而是一套标准,短短三个月不到的时间,其他大模型厂商就陆续跟进了这套标准,现在Cursor/Trae/Coze/Copilot/Manus等等大模型工具都已具备Skills的功能。

二、Agent Skills 工作原理

基本流程

  • 发现(Discovery):AI 工具先读取所有技能的元数据(name 和 description),判断任务是否相关,这些元数据始终在系统提示中。
  • 激活(Activation):当任务匹配某个技能的描述时,LLM才把完整的 SKILL.md 指令读入上下文。
  • 执行(Execution):LLM根据按照指令执行,配按需加载参考文件或调用AI工具运行代码。

需要注意的是,在Agent Skills的架构中,用户并不是和大模型直接交互的,中间一定有一个工具来存储我们的skill文件、协调任务的处理,这里的工具可以是Claude、copilot、cursor等等。在最终请求时,工具会把所需的信息和原本的用户输入合并成新的prompt,然后再发送给LLM,这一点是不是又有点像RAG🤔🤔。

大模型(LLM) Claude Code(AI工具) 用户(User) 大模型(LLM) Claude Code(AI工具) 用户(User) 发现阶段 激活阶段 执行阶段 启动工具 1 加载技能元数据(name + description) 2 输入指令 3 发送用户输入 + 技能元数据 4 匹配技能(description 命中) 5 读取 SKILL.md 完整指令 6 发送用户输入 + SKILL.md 7 请求执行操作(如需脚本/文件) 8 执行 Bash/工具/读取参考文件 9 返回执行结果 10 生成最终响应 11 返回最终答案 12

渐进式披露架构

Agent Skills采用的是渐进式披露架构,这又是啥玩意?😓。
渐进式披露,说白了就是我需要什么再拿什么,我不需要就不拿

  • 发现阶段:咱只需要拿所有skill的元数据,因为触不触发还不一定呢,有可能今天咱就压根用不到skill呢,把所有内容都加载岂不是浪费了。
  • 激活阶段:既然激活了某个任务,那我也先只加载核心指令SKILL.md,其他的文件均不加载。
  • 执行阶段:如果md正文里说,我需要时读取额外的某个文件(如脚本、示例)时,我再去读指定文件,否则不加载。

这样的渐进式架构能很好的节省token费用和提升效率,如果我们不管有没有触发特定任务,每次都将skill文件夹里的内容输入给AI,会造成大量的浪费,无关的上下文token也会影响任务本身的执行结果。

Prompt 工程的工程

如果你已经很了解RAG/MCP/Prompt工程等这些技术的话,你一定会跟我有同感,总感觉Agent Skills和这些“前辈”技术似乎有点像。在我看来,Agent Skills是用RAG和MCP的思想将Prompt工程进行了工程化。听起来有点复杂,让我们娓娓道来:

Prompt工程的遗留问题

问题 说明
一次性 每次对话重新输入,无法沉淀
难维护 版本混乱,改一处,处处改
无权限 只能"说",不能"做"(执行脚本)

如果说Prompt工程解决了怎么把Prompt 写好,Skills则解决了怎么把Prompt 用好:怎么把已经写好的Prompt工程进行存储、调用、版本管理,我称之为Prompt 工程的工程。

用MCP思想实现调用:MCP就是利用LLM自身的能力去判断用户指令是否需要调用相应的接口,Skills用description作为标识,让LLM判断是否需要调用对应的skill.md文件。更进一步,通过读取文件中的指令,判别是否需要调用脚本来执行。
用RAG思想实现拼接:RAG通过引入外部信息和原本的用户输入拼接,再输入大模型,让模型拥有挂载知识库的能力。Skills则通过中间工具让模型挂载了一个Prompt库(或者说是“任务说明书“库),通过将所需的Prompt与原本的用户输入做拼接,再输入大模型。

不得不说,Agent Skills的设计真的有点东西,把各种“前辈”技术的设计思想都利用了起来,这让其拥有更加广泛的应用场景,在实现某些功能时,相比用langchain搭建一个agent项目要轻便很多。但是它也有很大的局限性,其中一点就是你必须先有一个AI工具,比如Claude code、Cursor、Copilot,在这些工具上我们才能构建skill,对普通人来说是有一定门槛的。Agent Skills并不能完全替代像MCP/RAG这样的“前辈”技术,我们更应该将其当成一个大模型增强技术体系的补充,通过灵活组合这些技术,更好的满足用户的需求。

三、Skills在Copilot上的实践(拿来主义:三分钟搞定)

鄙人条件有限没有Claude,咱用Copilot来实操一下,实际上试下来基本一样。秉持不重复造轮子的原则,我们这次不自己写了,直接拿skill市场中现成的一个:agent-browser,这个skill的主要功能就是浏览网页。

1)安装skill

###在根目录或项目目录执行
npx skills add https://github.com/vercel-labs/agent-browser --skill agent-browser

然后它会让你选一个工具,这里可以看到skill生态已经相当庞大了,支持的工具已经达到几十种,这里我们选GitHub Copilot。
在这里插入图片描述
然后一路下一步就完事了,最后你会看到你的目录下生成了相关文件,其中SKILL.md是核心文件,其他是可以调用的脚本和资源文件。
请添加图片描述
为了确保这个skill被成功加载,可以在copilot聊天窗口输入指令”我现在有哪些Agent skills”来确认是否安装完成,如果没有则用重启大法,重启vscode。

2)使用
在chat窗口输入用户指令

使用 agent-browser Skill,帮我模拟浏览器访问 https://example.com,列出该网页的标题、核心内容,以及页面上的所有按钮元素

我们可以看到,agent-browser被调用然后一路各种执行,整体的完成率还是可以的。
请添加图片描述
请添加图片描述

四、Agent Skills相关资源整理

本文对Agent Skills的研究只是蜻蜓点水,若要系统深入学习请参考如下链接:

资源说明 链接
Skill 聚合入口 https://skills.sh/
Skills 市场(中文界面) https://skillsmp.com/zh
Agent Skills 官方标准站点 https://agentskills.io
Anthropic 官方工程文章(Agent Skills 实战理念) https://www.anthropic.com/engineering/equipping-agents-for-the-real-world-with-agent-skills
VS Code Copilot Agent Skills 文档 https://code.visualstudio.com/docs/copilot/customization/agent-skills
Anthropic 官方 Skills GitHub 仓库 https://github.com/anthropics/skills
Claude 技能精选列表(Awesome 系列) https://github.com/ComposioHQ/awesome-claude-skills
软件开发自动化工作流 Skills 集合 https://github.com/obra/superpowers
自动生成 Skill 的 Skill(官方示例) https://github.com/anthropics/skills/tree/main/skills/skill-creator
Logo

小龙虾开发者社区是 CSDN 旗下专注 OpenClaw 生态的官方阵地,聚焦技能开发、插件实践与部署教程,为开发者提供可直接落地的方案、工具与交流平台,助力高效构建与落地 AI 应用

更多推荐