了解skills
Skills作为2025年下半年兴起的人工智能领域关键技术范式,通过将专业知识、操作流程和执行脚本封装为可复用的模块化单元,从根本上改变了AI从对话到做事的能力边界。,截至2026年1月,全球Skills项目数量已超过105,000个,保持指数级增长态势。Anthropic官方定义指出,Skills是模块化的能力,扩展了Agent的功能。每个Skill都打包了LLM指令、元数据、可选资源(脚本、模
摘要
Skills作为2025年下半年兴起的人工智能领域关键技术范式,通过将专业知识、操作流程和执行脚本封装为可复用的模块化单元,从根本上改变了AI从对话到做事的能力边界。,截至2026年1月,全球Skills项目数量已超过105,000个,保持指数级增长态势。
1. 引言
1.1 背景
过去两年,大模型最让人惊艳的能力是会写、会答、会总结。但当你真的把它放进工作流:写稿要查证、做分析要跑数、做运营要发邮件、做客服要查订单,你会很快发现,能生成不等于能完成任务。真正能把AI变成生产力的关键,不是再换一个更大的模型,而是把它变成一个可管理、可复用、可上线的系统:Agent(智能体)。而让Agent稳定做事的核心构件,就是Agent Skills。
2025年10月中旬,Anthropic正式发布Claude Skills。两个月后的2025年12月18日,Anthropic做出了一项重要决定:将Skills发布为开放标准。这意味着任何AI平台、任何开发工具,都可以实现Skills标准。随后,产业界迅速跟进。OpenAI、GitHub、VS Code、Cursor等主流开发工具均已宣布支持Skills标准。2026年1月19日,字节跳动旗下AI Agent平台扣子更新,上线技能商店,成为国内首个推出类似功能的大厂平台【1】。
1.2 Skills的真实价值
Skills的价值远超于简单的工具扩展。智源社区一篇文章指出,Skills的价值还是被大大低估了。一个好Skill能发挥的智能效果,甚至能轻松等同、超越完整的AI产品。任何不懂技术的人,都能开发属于自己的Skills【2】。
从开发者视角来看,通用Agent内核配合Skills设计,能够低成本创造具有通用AI智能上限的垂直Agent应用。这种范式正在重塑AI应用的开发方式:从为每个场景重建定制智能体转向构建可复用的技能库【3】。
2. Skills概念与架构设计
2.1 什么是Skills
Anthropic官方定义指出,Skills是模块化的能力,扩展了Agent的功能。每个Skill都打包了LLM指令、元数据、可选资源(脚本、模板等),Agent会在需要时自动使用它们【4】。
一个更直观的解释是,Skill就像给Agent准备的工作交接SOP大礼包。想象你要把一项工作交给新同事,若不准口口相传,只靠文档交接,而且你想一次性交接完成,以后不被打扰,你会准备什么?任务的执行SOP与必要背景知识、工具的使用说明、要用到的模板和素材、可能遇到的问题和解决方案。Skill的设计架构,几乎是交接大礼包的数字版本【2】。
2.2 Skills的三层架构设计
AI TOP100的一篇深度科普文章提出,可以用元信息(Metadata)、指令(Instruction)、资源(Resources)三层架构来理解Agent Skills。这一框架与Anthropic官方规范高度一致,且对新手友好、对高手可直接落地【5】。
2.2.1 架构总览
可以把一个Skill想象成一个小产品。三层架构就是它的产品结构:
Metadata层是技能的说明书加合同加配置入口。它回答这个Skill叫什么,解决什么问题,适合谁用,输入输出是什么结构,成功标准是什么,有哪些风险与边界,哪些动作必须人工确认,成本预算、权限等级、版本信息是什么。没有Metadata的Agent,通常会变成写得很好但不可控,要么乱调用工具,要么输出风格漂移,要么越权执行。
Instruction层是技能的操作系统。它不是一句请你专业一点,而是可执行的SOP,包括先澄清哪些信息,缺什么就问什么,什么情况下必须检索,什么情况下不该检索,工具如何选择、调用顺序是什么、失败怎么兜底,结果如何验证、冲突证据如何处理,输出格式、引用规范、口吻要求,最终如何自检与验收。
Resources层是技能的手脚加资料库加观测系统。包括工具和函数,如API、数据库、企业系统、自动化脚本,检索与知识,如RAG(向量库、文档库、网页、内网),执行环境,如代码执行、浏览器自动化、工作流引擎,可观测与评估,如Tracing、日志、评测集、告警【5】。
2.2.2 Metadata元信息层
在Anthropic官方规范中,Metadata以YAML前置内容形式存在于SKILL.md文件头部。name字段为技能名称,使用小写字母和连字符分隔。description字段描述技能功能及调用场景,必须使用第三人称,包含触发关键词【4】。
阿里云开发者社区的一篇文章强调,Metadata层决定技能生死。只有100词的配额,但这100词决定了技能何时被Claude选中。description必须精炼、准确、全面【6】。
2.2.3 Instruction指令主体层
在研究与工程实践里,ReAct(Reasoning and Acting)范式之所以重要,是因为它强调推理与行动交织,边想边查边改,用外部信息抑制幻觉与错误传播【5】。
Anthropic官方建议Instruction层控制在500行以内效果最佳,超过限制应拆分到references目录中,避免上下文膨胀(context bloat)【4】。
2.2.4 Resources资源层
当Agent上线后,你要能回答它为什么慢、为什么错、错在检索还是工具、有没有越权。这就需要观测体系。OpenTelemetry强调对于非确定性的AI agent,遥测数据不仅用于监控,更是持续改进的反馈回路【5】。
2.3 标准文件结构
根据Anthropic官方规范和开源社区的实践,一个标准的Skill采用如下文件结构【4】:
skill-name目录下包含SKILL.md核心技能定义文件(必需)。该文件包含YAML frontmatter(必需),其中name字段(必需)和description字段(必需),以及Markdown instructions(必需)。
可选的捆绑资源(Bundled Resources)包括scripts目录存放可执行代码,如Python/Bash等;references目录存放参考文档,按需加载;assets目录存放资源文件,如模板、图标等【4】。
关键说明方面,scripts存放可执行代码,token高效,可执行而不读入上下文。references存放文档和参考材料,按需加载到上下文,保持SKILL.md精简。assets存放输出中使用的文件,不读入上下文【4】。
Anthropic明确指出,技能不应该包含额外的文档或辅助文件,如README.md、INSTALLATION_GUIDE.md等。技能应该只包含AI代理完成工作所需的信息,不应该包含创建过程的辅助上下文【4】。
2.4 官方技能示例
以Anthropic官方Skills仓库中的几个典型技能为例:
PDF Skill包含PDF合并、拆分、文本提取等代码脚本,教会Agent如何处理PDF文件,提取文本、创建新的PDF、合并或拆分文档【4】。
Brand-guidelines Skill包含品牌设计规范、Logo资源等,Agent设计网站、海报时,可参考Skill内的设计资源,自动遵循企业设计规范【4】。
Skill-creator把创建Skill的方法打包成元Skill,让AI发起Skill创建流程,引导用户创建出符合需求的高水准Skill【4】。
3. 核心技术创新:渐进式披露机制
3.1 机制原理
渐进式披露(Progressive Disclosure)是Skills系统的核心架构设计。它不是把所有信息一次性塞给Claude,而是分三层加载,根据需要逐步展示。这一机制有效解决了传统System Prompt一次性注入、随对话变长而被稀释的问题【6】。
阿里云开发者社区的一篇文章详细拆解了三层加载架构【6】:
第一层是Metadata(元数据),内容包括name加description,加载时机为始终在上下文中,Token配额约100词,作用是决定技能何时触发。
第二层是SKILL.mdbody(技能主体),内容包括具体指令、使用指南、注意事项,加载时机为技能触发后,Token配额小于5000词,建议小于500行,作用是核心工作流程。
第三层是Bundled resources(捆绑资源),内容包括scripts、references、assets,加载时机为按需加载,Token配额无限(scripts可执行而不读入上下文),作用是详细参考和可执行代码。
3.2 核心设计哲学
从三层架构可以清晰看出官方的设计哲学【6】:
元数据决定生死。只有100词的配额,但这100词决定了技能何时被Claude选中。description必须精炼、准确、全面。主体要精简。建议小于5000词,即小于500行,超过限制要拆分到references,避免上下文膨胀。资源按需加载。scripts可执行但不读入上下文,token高效。references仅在需要时加载。assets用于输出,不占用上下文。
3.3 Token消耗公式
根据三层架构,单个Skill的总Token消耗可表示为【6】:
总Token消耗等于100词(metadata)加5000词(body)加按需资源(scripts/references/assets)。
这意味着一个Agent可以装备100个技能,但平时几乎不占用上下文,元数据约100 tokens,只有在干活时才打开说明书,完整SKILL.md约3000 tokens。单个技能在启动时仅消耗30到50个tokens,实现了极高的上下文效率【1】。
3.4 优化建议
基于Token消耗公式,可以总结出优化Skills的三个原则【6】:
1.Metadata层要精准触发。description必须包含技能功能加使用场景加具体触发条件,避免模糊描述,用数字编号列出场景。
2.Body层要核心流程。只保留核心工作流程和选择指导,变体细节、示例、配置移到references,保持小于500行。
3.Resources层要按需拆分。scripts存放重复执行的代码,token高效。references存放文档、API说明,按需加载。assets存放模板、图标,输出用。
4. Skills与相关概念的对比辨析
4.1 Skills vs Prompt
CSDN的一篇文章用带新人的比喻清晰解释了两者的差异【7】:
1.Prompt(提示词)像你站在新人旁边口头交代任务,适合一次性、临场性指令,对话结束就失效,无复用性。
2.Skills(技能包)像给新人的SOP手册文件夹,里面有规范、脚本、模板等资源,新人(Agent)会按需查阅。核心是可复用、能引导迭代,还能通过渐进式披露省Token,先加载目录,需用时再读详情。
3.另一篇文章也指出,Skills可以被形象地理解为超级进化版的提示词【1】。
4.2 Skills vs MCP
MCP(Model Context Protocol,模型上下文协议)是由Anthropic推出的开放标准协议,关注的是AI如何以统一方式调用外部的工具、数据和服务【8】。
核心区别方面,Skills负责干具体的事,是任务执行模块,封装脚本和模板,直接执行任务。MCP负责连通外部世界,是系统连接协议,接入外部数据源、服务【1】。腾讯云开发者社区一篇文章指出,MCP管的是Agent怎么伸手碰世界,Skills管的是Agent脑子里的一套打法【9】。
两者关系是Skills与MCP互补而非替代。Zilliz技术博客明确指出,Skills会取代MCP吗?很显然,答案是否定的【8】。Skills加MCP可形成强大的组合拳,用Skill生成测试报告,用MCP自动上传到Jira或TestRail【1】。如果说MCP解决了手的问题,即工具连接,那么Skills则解决了脑的问题,即专业知识【10】。
4.3 Skills vs Workflow
传统Workflow的核心问题是假设所有情况都能预设,遇到意外就报错。而通用Agent加Skill应用能在统一的对话框接收各类用户数据,自主调用其他Skill或即时编写脚本,自主转换格式,基于LLM的推理智能弥合各类边缘问题,智源社区一篇文章总结,几乎所有能用Workflow完成的AI任务,都能用Agent加Skills实现【2】。
4.4 Skills与Projects、Subagents的对比
根据Anthropic官方文档【4】:
Projects是独立工作区,含专属聊天记录和知识库,支持200K上下文窗口,超出限制时自动启用RAG模式扩展10倍容量。Subagents是具备独立上下文窗口、自定义系统提示和工具权限的专门AI助手,可独立执行任务并反馈结果。
5. 技术原理:
5.1 工具和函数调用:
典型链路是把工具定义,即函数schema,与用户问题一起发给模型,模型决定要调用哪个工具,并给出结构化参数,你的系统执行工具,把结果回填给模型,模型基于结果生成最终答复或继续调用更多工具【5】。
这套流程是主流平台共同的基础能力。关键工程点是可控,包括函数名、参数、严格模式、并行调用,以及何时用、何时不用的规则要写清楚,否则模型会看起来很努力,但越努力越容易出错【5】。
5.2 RAG检索增强生成:
当要求模型不要编造但不给它可靠来源,它只能靠猜。RAG的意义是把事实从模型参数中解耦出来,交给可更新的数据源,包括文档库、网页、产品手册、内部知识等【5】。更进一步的Agentic RAG是智能体能判断何时检索、检索什么、如何验证检索结果,以及检索不到时怎么办【5】。
5.3 观测与评估:
当Agent进入生产环境,最重要的能力不是偶尔答对,而是持续变好。因此需要追踪每一步工具调用与检索证据链,统计成功率、耗时、成本、失败原因,用评测集做回归测试,防止改好一个bug,引入三个新bug【5】。
LlamaIndex在其可观测性指南里明确,构建RAG和Agent的关键要求之一就是可观察、可调试、可评估,并支持把traces导出到OpenTelemetry等系统【5】。
6. 生态发展与安全考量
6.1 生态规模数据
截至2026年1月,Skills生态呈现爆发式增长【2】:
全球Skills项目数量超过105,000个,保持指数级增长速度。已衍生出多个Skills市场,如skill.sh、skillstore.io等。扣子平台上一个名为花叔的自动化写作的技能已有4800人安装【1】。
6.2 攻击面分析
随着Skills生态的快速发展,安全问题日益凸显。天元实验室大模型安全团队对Skills架构的攻击面进行了系统分析【11】。
6.2.1 架构固有风险
Skills架构依托提示词加可执行脚本的组合提升灵活性与操作规范性,但设计阶段缺乏统一、规范且包含安全验证的分发渠道。这导致风险传导的起点位于供应链的薄弱环节:攻击者可通过依赖混淆、托管平台攻击或开发工具代码库入侵等手段对Skills进行投毒污染【11】。
6.2.2 两类核心输入风险
提示词风险方面,被篡改后会扰乱模型决策路径,造成内容生成偏差、输出违背预期甚至引导模型执行不安全指令,引发内容安全风险与提示词安全风险【11】。
脚本风险方面,作为直接在本机执行的逻辑载体,若植入恶意代码或通过恶意包引入,可能在执行时突破权限边界,触发未授权系统命令执行,导致系统破坏、敏感数据泄露【11】。
6.3 生态安全现状调研
天元实验室在Skill商店中采样了近700个Skill进行安全分析,采用AI辅助分析手段从静态扫描、动态分析和依赖审计三个维度检测【11】。
风险分布统计显示,严重风险8个,占比约21.1%;中等风险15个,占比约39.5%;低风险15个,占比约39.5%。
风险类别统计显示,代码执行类风险20个,占比最高,主要源于脚本中shell=True等不安全命令调用。文档类风险18个,多为提及exploit、payload等敏感关键词。输入验证风险11个,文件操作风险10个,网络安全风险8个,密码学风险5个。
受影响项目类型方面,安全工具类项目22个,影响最大。教育内容类项目18个。其余如数据库客户端、浏览器自动化等项目受影响相对较少。
分析表明,绝大多数风险集中于安全工具与教育内容类别,这些风险更多源自工具的研究属性与安全教学场景需求,而非恶意攻击意图【11】。
7. 未来展望
7.1 技术发展趋势
Skills的出现正在重塑AI工程化的基本范式。Anthropic核心工程师Barry Zhang在一个行业论坛上指出,别造Agent了,造Skills就行【2】。这一观点揭示了Skills的战略价值:与其为每个场景重建定制智能体,不如构建可复用的技能库【2】。
腾讯云开发者社区一篇文章指出,现在行业趋势已经很清楚了,工具接入这块,有了MCP在快速统一,主流厂商都在往这个标准靠。能力建模这块,大模型厂在推自己的Skills模型,把技能做成可配置、可组合、可下发的能力包,而不是散乱的插件【9】。
7.2 对企业和个人的影响
有熟练使用Skills的开发者指出,这实际上是把工作流程原子化了,未来企业的竞争力有可能直接取决于私有Skills的沉淀数量与质量,取决于能否将隐性知识高效转化为标准化的可执行模块【2】。
对个人而言,让大模型变得越来越聪明是巨头们的事,但Skills才是能让普通人也可以拥有技能的落地功能。如何让大模型更理解你,更好地帮你干活儿,建立自己的Skills或是机会之一,这才是AI时代真正的护城河【2】。
7.3 标准化与生态演进
Skills从单一厂商的实验性功能到全球AI巨头的集体跟进,用了不到3个月时间【1】。这一速度预示着AI技术标准化的新阶段。MS-Agent框架已实现对Anthropic Skills协议的完全兼容,为中文开发者提供了完整实现【1】。
未来Skills的发展方向可能包括增加熟练度等级,开发开放课程,创建特定行业配置文件,完善AI工具以实现大规模技能提取【1】。
8. 结论
Skills作为AI智能体的核心能力封装机制,通过元数据-指令主体-捆绑资源的三层架构设计和渐进式披露的创新机制,实现了专业知识的高效复用和任务执行的标准化。它与MCP形成互补关系,Skills负责干具体的事,MCP负责连通外部世界,两者协同构建完整的AI智能体能力体系。
截至2026年1月,全球Skills项目数量已超过105,000个,保持指数级增长。这一生态的快速发展既带来了生产力的巨大提升,也引入了新的安全挑战。通过官方渠道获取Skill、启用沙箱执行环境、实施上线前安全扫描,可有效降低安全风险。
Skills正在改变AI的使用方式,从每次都得教一遍到学会一遍,终身受益。对于组织而言,私有Skills的沉淀数量与质量将构成未来的核心竞争力。对于个人,构建自己的技能库是让AI更懂自己、更好为自己服务的关键路径【2】。
Skills不是AI圈的新词炒作,而是把流程化知识变成可复用、能自检、会迭代的能力包。当第一个Skill跑起来时,你就会理解,复用带来的效率提升,才是它的魅力所在【2】。
9. 参考文献
[1] 磊哥. (2026). 保姆级喂饭教程:什么是Skills?如何用Skills?. CSDN. https://blog.csdn.net/sufu1065/article/details/156994332
[2] 霍格沃兹测试学院. (2025). 有了MCP,为啥Claude还要推出Skills?一文带你搞懂它到底强在哪?. CSDN. https://blog.csdn.net/hogwarts_beibei/article/details/154398698
[3] 小九. (2026). 一文读懂AI圈爆火的Skills:是什么、怎么用. CSDN. https://grapecity.csdn.net/697c17247c1d88441d90a0bb.html
[4] 尹珉. (2025). Skills 取代MCP?是agent落地最大的误解. Zilliz博客. https://zilliz.com.cn/blog/Skills-replacing-MCP-biggest-agent-misconception
[5] 一泽Eze. (2026). 从入门到用好 Agent Skills,看这一篇就足够了. 智源社区. https://hub.baai.ac.cn/view/52082
[6] 魔搭社区编辑部. (2025). Agent Skills技术协议与开源实现. ModelScope. https://www.modelscope.cn/learn/2558
[7] 罗亦丹. (2026). 爆火的Skills如何给大模型加入“技能”?记者实测. 新京报. https://m.bjnews.com.cn/detail/1769047462168003.html
[8] 七牛云. (2026). Skills与MCP实战指南:区别与协同技巧. https://news.qiniu.com/archives/1768377400632
[9] 天元实验室大模型安全团队. (2026). 深度剖析:Skills架构攻击面、实战案例与开源生态调研. Cnetsec. https://www.cnetsec.com/article/43391.html
[10] UK Government. (2025). UK Standard Skills Classification: Executive summary. GOV.UK. https://www.gov.uk/government/publications/uk-standard-skills-classification-interim-development-report/executive-summary-introduction-and-acknowledgements
[11] National Center for ONET Development. (2025). Technical Skills. ONET OnLine. https://www.onetonline.org/find/descriptor/browse/Skills/2.B.3/
[12] National Center for O*NET Development. (2026). Technology Skills - O*NET 23.2 Data Dictionary. O*NET Resource Center. https://www.onetcenter.org/dictionary/23.2/mysql/technology_skills.html
更多推荐




所有评论(0)