了解skills

Skills作为2025年下半年兴起的人工智能领域关键技术范式，通过将专业知识、操作流程和执行脚本封装为可复用的模块化单元，从根本上改变了AI从对话到做事的能力边界。，截至2026年1月，全球Skills项目数量已超过105,000个，保持指数级增长态势。Anthropic官方定义指出，Skills是模块化的能力，扩展了Agent的功能。每个Skill都打包了LLM指令、元数据、可选资源（脚本、模

m0_73968991

424人浏览 · 2026-04-01 16:23:10

m0_73968991 · 2026-04-01 16:23:10 发布

摘要

Skills作为2025年下半年兴起的人工智能领域关键技术范式，通过将专业知识、操作流程和执行脚本封装为可复用的模块化单元，从根本上改变了AI从对话到做事的能力边界。，截至2026年1月，全球Skills项目数量已超过105,000个，保持指数级增长态势。

1. 引言

1.1 背景

过去两年，大模型最让人惊艳的能力是会写、会答、会总结。但当你真的把它放进工作流：写稿要查证、做分析要跑数、做运营要发邮件、做客服要查订单，你会很快发现，能生成不等于能完成任务。真正能把AI变成生产力的关键，不是再换一个更大的模型，而是把它变成一个可管理、可复用、可上线的系统：Agent（智能体）。而让Agent稳定做事的核心构件，就是Agent Skills。

2025年10月中旬，Anthropic正式发布Claude Skills。两个月后的2025年12月18日，Anthropic做出了一项重要决定：将Skills发布为开放标准。这意味着任何AI平台、任何开发工具，都可以实现Skills标准。随后，产业界迅速跟进。OpenAI、GitHub、VS Code、Cursor等主流开发工具均已宣布支持Skills标准。2026年1月19日，字节跳动旗下AI Agent平台扣子更新，上线技能商店，成为国内首个推出类似功能的大厂平台【1】。

1.2 Skills的真实价值

Skills的价值远超于简单的工具扩展。智源社区一篇文章指出，Skills的价值还是被大大低估了。一个好Skill能发挥的智能效果，甚至能轻松等同、超越完整的AI产品。任何不懂技术的人，都能开发属于自己的Skills【2】。

从开发者视角来看，通用Agent内核配合Skills设计，能够低成本创造具有通用AI智能上限的垂直Agent应用。这种范式正在重塑AI应用的开发方式：从为每个场景重建定制智能体转向构建可复用的技能库【3】。

2. Skills概念与架构设计

2.1 什么是Skills

Anthropic官方定义指出，Skills是模块化的能力，扩展了Agent的功能。每个Skill都打包了LLM指令、元数据、可选资源（脚本、模板等），Agent会在需要时自动使用它们【4】。

一个更直观的解释是，Skill就像给Agent准备的工作交接SOP大礼包。想象你要把一项工作交给新同事，若不准口口相传，只靠文档交接，而且你想一次性交接完成，以后不被打扰，你会准备什么？任务的执行SOP与必要背景知识、工具的使用说明、要用到的模板和素材、可能遇到的问题和解决方案。Skill的设计架构，几乎是交接大礼包的数字版本【2】。

2.2 Skills的三层架构设计

AI TOP100的一篇深度科普文章提出，可以用元信息（Metadata）、指令（Instruction）、资源（Resources）三层架构来理解Agent Skills。这一框架与Anthropic官方规范高度一致，且对新手友好、对高手可直接落地【5】。

2.2.1 架构总览

可以把一个Skill想象成一个小产品。三层架构就是它的产品结构：

Metadata层是技能的说明书加合同加配置入口。它回答这个Skill叫什么，解决什么问题，适合谁用，输入输出是什么结构，成功标准是什么，有哪些风险与边界，哪些动作必须人工确认，成本预算、权限等级、版本信息是什么。没有Metadata的Agent，通常会变成写得很好但不可控，要么乱调用工具，要么输出风格漂移，要么越权执行。

Instruction层是技能的操作系统。它不是一句请你专业一点，而是可执行的SOP，包括先澄清哪些信息，缺什么就问什么，什么情况下必须检索，什么情况下不该检索，工具如何选择、调用顺序是什么、失败怎么兜底，结果如何验证、冲突证据如何处理，输出格式、引用规范、口吻要求，最终如何自检与验收。

Resources层是技能的手脚加资料库加观测系统。包括工具和函数，如API、数据库、企业系统、自动化脚本，检索与知识，如RAG（向量库、文档库、网页、内网），执行环境，如代码执行、浏览器自动化、工作流引擎，可观测与评估，如Tracing、日志、评测集、告警【5】。

2.2.2 Metadata元信息层

在Anthropic官方规范中，Metadata以YAML前置内容形式存在于SKILL.md文件头部。name字段为技能名称，使用小写字母和连字符分隔。description字段描述技能功能及调用场景，必须使用第三人称，包含触发关键词【4】。

阿里云开发者社区的一篇文章强调，Metadata层决定技能生死。只有100词的配额，但这100词决定了技能何时被Claude选中。description必须精炼、准确、全面【6】。

2.2.3 Instruction指令主体层

在研究与工程实践里，ReAct（Reasoning and Acting）范式之所以重要，是因为它强调推理与行动交织，边想边查边改，用外部信息抑制幻觉与错误传播【5】。

Anthropic官方建议Instruction层控制在500行以内效果最佳，超过限制应拆分到references目录中，避免上下文膨胀（context bloat）【4】。

2.2.4 Resources资源层

当Agent上线后，你要能回答它为什么慢、为什么错、错在检索还是工具、有没有越权。这就需要观测体系。OpenTelemetry强调对于非确定性的AI agent，遥测数据不仅用于监控，更是持续改进的反馈回路【5】。

2.3 标准文件结构

根据Anthropic官方规范和开源社区的实践，一个标准的Skill采用如下文件结构【4】：

skill-name目录下包含SKILL.md核心技能定义文件（必需）。该文件包含YAML frontmatter（必需），其中name字段（必需）和description字段（必需），以及Markdown instructions（必需）。

可选的捆绑资源（Bundled Resources）包括scripts目录存放可执行代码，如Python/Bash等；references目录存放参考文档，按需加载；assets目录存放资源文件，如模板、图标等【4】。

关键说明方面，scripts存放可执行代码，token高效，可执行而不读入上下文。references存放文档和参考材料，按需加载到上下文，保持SKILL.md精简。assets存放输出中使用的文件，不读入上下文【4】。

Anthropic明确指出，技能不应该包含额外的文档或辅助文件，如README.md、INSTALLATION_GUIDE.md等。技能应该只包含AI代理完成工作所需的信息，不应该包含创建过程的辅助上下文【4】。

2.4 官方技能示例

以Anthropic官方Skills仓库中的几个典型技能为例：

PDF Skill包含PDF合并、拆分、文本提取等代码脚本，教会Agent如何处理PDF文件，提取文本、创建新的PDF、合并或拆分文档【4】。

Brand-guidelines Skill包含品牌设计规范、Logo资源等，Agent设计网站、海报时，可参考Skill内的设计资源，自动遵循企业设计规范【4】。

Skill-creator把创建Skill的方法打包成元Skill，让AI发起Skill创建流程，引导用户创建出符合需求的高水准Skill【4】。

3. 核心技术创新：渐进式披露机制

3.1 机制原理

渐进式披露（Progressive Disclosure）是Skills系统的核心架构设计。它不是把所有信息一次性塞给Claude，而是分三层加载，根据需要逐步展示。这一机制有效解决了传统System Prompt一次性注入、随对话变长而被稀释的问题【6】。

阿里云开发者社区的一篇文章详细拆解了三层加载架构【6】：

第一层是Metadata（元数据），内容包括name加description，加载时机为始终在上下文中，Token配额约100词，作用是决定技能何时触发。

第二层是SKILL.mdbody（技能主体），内容包括具体指令、使用指南、注意事项，加载时机为技能触发后，Token配额小于5000词，建议小于500行，作用是核心工作流程。

第三层是Bundled resources（捆绑资源），内容包括scripts、references、assets，加载时机为按需加载，Token配额无限（scripts可执行而不读入上下文），作用是详细参考和可执行代码。

3.2 核心设计哲学

从三层架构可以清晰看出官方的设计哲学【6】：

元数据决定生死。只有100词的配额，但这100词决定了技能何时被Claude选中。description必须精炼、准确、全面。主体要精简。建议小于5000词，即小于500行，超过限制要拆分到references，避免上下文膨胀。资源按需加载。scripts可执行但不读入上下文，token高效。references仅在需要时加载。assets用于输出，不占用上下文。

3.3 Token消耗公式

根据三层架构，单个Skill的总Token消耗可表示为【6】：

总Token消耗等于100词（metadata）加5000词（body）加按需资源（scripts/references/assets）。

这意味着一个Agent可以装备100个技能，但平时几乎不占用上下文，元数据约100 tokens，只有在干活时才打开说明书，完整SKILL.md约3000 tokens。单个技能在启动时仅消耗30到50个tokens，实现了极高的上下文效率【1】。

3.4 优化建议

基于Token消耗公式，可以总结出优化Skills的三个原则【6】：

1.Metadata层要精准触发。description必须包含技能功能加使用场景加具体触发条件，避免模糊描述，用数字编号列出场景。

2.Body层要核心流程。只保留核心工作流程和选择指导，变体细节、示例、配置移到references，保持小于500行。

3.Resources层要按需拆分。scripts存放重复执行的代码，token高效。references存放文档、API说明，按需加载。assets存放模板、图标，输出用。

4. Skills与相关概念的对比辨析

4.1 Skills vs Prompt

CSDN的一篇文章用带新人的比喻清晰解释了两者的差异【7】：

1.Prompt（提示词）像你站在新人旁边口头交代任务，适合一次性、临场性指令，对话结束就失效，无复用性。

2.Skills（技能包）像给新人的SOP手册文件夹，里面有规范、脚本、模板等资源，新人（Agent）会按需查阅。核心是可复用、能引导迭代，还能通过渐进式披露省Token，先加载目录，需用时再读详情。

3.另一篇文章也指出，Skills可以被形象地理解为超级进化版的提示词【1】。

4.2 Skills vs MCP

MCP（Model Context Protocol，模型上下文协议）是由Anthropic推出的开放标准协议，关注的是AI如何以统一方式调用外部的工具、数据和服务【8】。

核心区别方面，Skills负责干具体的事，是任务执行模块，封装脚本和模板，直接执行任务。MCP负责连通外部世界，是系统连接协议，接入外部数据源、服务【1】。腾讯云开发者社区一篇文章指出，MCP管的是Agent怎么伸手碰世界，Skills管的是Agent脑子里的一套打法【9】。

两者关系是Skills与MCP互补而非替代。Zilliz技术博客明确指出，Skills会取代MCP吗？很显然，答案是否定的【8】。Skills加MCP可形成强大的组合拳，用Skill生成测试报告，用MCP自动上传到Jira或TestRail【1】。如果说MCP解决了手的问题，即工具连接，那么Skills则解决了脑的问题，即专业知识【10】。

4.3 Skills vs Workflow

传统Workflow的核心问题是假设所有情况都能预设，遇到意外就报错。而通用Agent加Skill应用能在统一的对话框接收各类用户数据，自主调用其他Skill或即时编写脚本，自主转换格式，基于LLM的推理智能弥合各类边缘问题,智源社区一篇文章总结，几乎所有能用Workflow完成的AI任务，都能用Agent加Skills实现【2】。

4.4 Skills与Projects、Subagents的对比

根据Anthropic官方文档【4】：

Projects是独立工作区，含专属聊天记录和知识库，支持200K上下文窗口，超出限制时自动启用RAG模式扩展10倍容量。Subagents是具备独立上下文窗口、自定义系统提示和工具权限的专门AI助手，可独立执行任务并反馈结果。

5. 技术原理：

5.1 工具和函数调用：

典型链路是把工具定义，即函数schema，与用户问题一起发给模型，模型决定要调用哪个工具，并给出结构化参数，你的系统执行工具，把结果回填给模型，模型基于结果生成最终答复或继续调用更多工具【5】。

这套流程是主流平台共同的基础能力。关键工程点是可控，包括函数名、参数、严格模式、并行调用，以及何时用、何时不用的规则要写清楚，否则模型会看起来很努力，但越努力越容易出错【5】。

5.2 RAG检索增强生成:

当要求模型不要编造但不给它可靠来源，它只能靠猜。RAG的意义是把事实从模型参数中解耦出来，交给可更新的数据源，包括文档库、网页、产品手册、内部知识等【5】。更进一步的Agentic RAG是智能体能判断何时检索、检索什么、如何验证检索结果，以及检索不到时怎么办【5】。

5.3 观测与评估：

当Agent进入生产环境，最重要的能力不是偶尔答对，而是持续变好。因此需要追踪每一步工具调用与检索证据链，统计成功率、耗时、成本、失败原因，用评测集做回归测试，防止改好一个bug，引入三个新bug【5】。

LlamaIndex在其可观测性指南里明确，构建RAG和Agent的关键要求之一就是可观察、可调试、可评估，并支持把traces导出到OpenTelemetry等系统【5】。

6. 生态发展与安全考量

6.1 生态规模数据

截至2026年1月，Skills生态呈现爆发式增长【2】：

全球Skills项目数量超过105,000个，保持指数级增长速度。已衍生出多个Skills市场，如skill.sh、skillstore.io等。扣子平台上一个名为花叔的自动化写作的技能已有4800人安装【1】。

6.2 攻击面分析

随着Skills生态的快速发展，安全问题日益凸显。天元实验室大模型安全团队对Skills架构的攻击面进行了系统分析【11】。

6.2.1 架构固有风险

Skills架构依托提示词加可执行脚本的组合提升灵活性与操作规范性，但设计阶段缺乏统一、规范且包含安全验证的分发渠道。这导致风险传导的起点位于供应链的薄弱环节：攻击者可通过依赖混淆、托管平台攻击或开发工具代码库入侵等手段对Skills进行投毒污染【11】。

6.2.2 两类核心输入风险

提示词风险方面，被篡改后会扰乱模型决策路径，造成内容生成偏差、输出违背预期甚至引导模型执行不安全指令，引发内容安全风险与提示词安全风险【11】。

脚本风险方面，作为直接在本机执行的逻辑载体，若植入恶意代码或通过恶意包引入，可能在执行时突破权限边界，触发未授权系统命令执行，导致系统破坏、敏感数据泄露【11】。

6.3 生态安全现状调研

天元实验室在Skill商店中采样了近700个Skill进行安全分析，采用AI辅助分析手段从静态扫描、动态分析和依赖审计三个维度检测【11】。

风险分布统计显示，严重风险8个，占比约21.1%；中等风险15个，占比约39.5%；低风险15个，占比约39.5%。

风险类别统计显示，代码执行类风险20个，占比最高，主要源于脚本中shell=True等不安全命令调用。文档类风险18个，多为提及exploit、payload等敏感关键词。输入验证风险11个，文件操作风险10个，网络安全风险8个，密码学风险5个。

受影响项目类型方面，安全工具类项目22个，影响最大。教育内容类项目18个。其余如数据库客户端、浏览器自动化等项目受影响相对较少。

分析表明，绝大多数风险集中于安全工具与教育内容类别，这些风险更多源自工具的研究属性与安全教学场景需求，而非恶意攻击意图【11】。

7. 未来展望

7.1 技术发展趋势

Skills的出现正在重塑AI工程化的基本范式。Anthropic核心工程师Barry Zhang在一个行业论坛上指出，别造Agent了，造Skills就行【2】。这一观点揭示了Skills的战略价值：与其为每个场景重建定制智能体，不如构建可复用的技能库【2】。

腾讯云开发者社区一篇文章指出，现在行业趋势已经很清楚了，工具接入这块，有了MCP在快速统一，主流厂商都在往这个标准靠。能力建模这块，大模型厂在推自己的Skills模型，把技能做成可配置、可组合、可下发的能力包，而不是散乱的插件【9】。

7.2 对企业和个人的影响

有熟练使用Skills的开发者指出，这实际上是把工作流程原子化了，未来企业的竞争力有可能直接取决于私有Skills的沉淀数量与质量，取决于能否将隐性知识高效转化为标准化的可执行模块【2】。

对个人而言，让大模型变得越来越聪明是巨头们的事，但Skills才是能让普通人也可以拥有技能的落地功能。如何让大模型更理解你，更好地帮你干活儿，建立自己的Skills或是机会之一，这才是AI时代真正的护城河【2】。

7.3 标准化与生态演进

Skills从单一厂商的实验性功能到全球AI巨头的集体跟进，用了不到3个月时间【1】。这一速度预示着AI技术标准化的新阶段。MS-Agent框架已实现对Anthropic Skills协议的完全兼容，为中文开发者提供了完整实现【1】。

未来Skills的发展方向可能包括增加熟练度等级，开发开放课程，创建特定行业配置文件，完善AI工具以实现大规模技能提取【1】。

8. 结论

Skills作为AI智能体的核心能力封装机制，通过元数据-指令主体-捆绑资源的三层架构设计和渐进式披露的创新机制，实现了专业知识的高效复用和任务执行的标准化。它与MCP形成互补关系，Skills负责干具体的事，MCP负责连通外部世界，两者协同构建完整的AI智能体能力体系。

截至2026年1月，全球Skills项目数量已超过105,000个，保持指数级增长。这一生态的快速发展既带来了生产力的巨大提升，也引入了新的安全挑战。通过官方渠道获取Skill、启用沙箱执行环境、实施上线前安全扫描，可有效降低安全风险。

Skills正在改变AI的使用方式，从每次都得教一遍到学会一遍，终身受益。对于组织而言，私有Skills的沉淀数量与质量将构成未来的核心竞争力。对于个人，构建自己的技能库是让AI更懂自己、更好为自己服务的关键路径【2】。

Skills不是AI圈的新词炒作，而是把流程化知识变成可复用、能自检、会迭代的能力包。当第一个Skill跑起来时，你就会理解，复用带来的效率提升，才是它的魅力所在【2】。

9. 参考文献

[1] 磊哥. (2026). 保姆级喂饭教程：什么是Skills？如何用Skills？. CSDN. https://blog.csdn.net/sufu1065/article/details/156994332

[2] 霍格沃兹测试学院. (2025). 有了MCP，为啥Claude还要推出Skills？一文带你搞懂它到底强在哪?. CSDN. https://blog.csdn.net/hogwarts_beibei/article/details/154398698

[3] 小九. (2026). 一文读懂AI圈爆火的Skills：是什么、怎么用. CSDN. https://grapecity.csdn.net/697c17247c1d88441d90a0bb.html

[4] 尹珉. (2025). Skills 取代MCP？是agent落地最大的误解. Zilliz博客. https://zilliz.com.cn/blog/Skills-replacing-MCP-biggest-agent-misconception

[5] 一泽Eze. (2026). 从入门到用好 Agent Skills，看这一篇就足够了. 智源社区. https://hub.baai.ac.cn/view/52082

[6] 魔搭社区编辑部. (2025). Agent Skills技术协议与开源实现. ModelScope. https://www.modelscope.cn/learn/2558

[7] 罗亦丹. (2026). 爆火的Skills如何给大模型加入“技能”？记者实测. 新京报. https://m.bjnews.com.cn/detail/1769047462168003.html

[8] 七牛云. (2026). Skills与MCP实战指南：区别与协同技巧. https://news.qiniu.com/archives/1768377400632

[9] 天元实验室大模型安全团队. (2026). 深度剖析：Skills架构攻击面、实战案例与开源生态调研. Cnetsec. https://www.cnetsec.com/article/43391.html

[10] UK Government. (2025). UK Standard Skills Classification: Executive summary. GOV.UK. https://www.gov.uk/government/publications/uk-standard-skills-classification-interim-development-report/executive-summary-introduction-and-acknowledgements

[11] National Center for ONET Development. (2025). Technical Skills. ONET OnLine. https://www.onetonline.org/find/descriptor/browse/Skills/2.B.3/

[12] National Center for O*NET Development. (2026). Technology Skills - O*NET 23.2 Data Dictionary. O*NET Resource Center. https://www.onetcenter.org/dictionary/23.2/mysql/technology_skills.html