从零吃透大模型Agent Skill：概念、用法与核心机制全解析

本文围绕大模型 Agent Skill 展开全面解析，从核心概念、基本用法、加载机制到与 MCP 的区别进行系统讲解。明确 Agent Skill 是教大模型处理任务的说明文档，以SKILL.md为核心配置文件，通过 Reference 提供参考知识、Script 执行外部脚本；重点拆解渐进式披露的三层加载机制，实现按需加载、大幅节省 Token；并清晰对比 Agent Skill 与 MCP 的

蜂蜜黄油呀土豆

612人浏览 · 2026-03-08 19:24:57

蜂蜜黄油呀土豆 · 2026-03-08 19:24:57 发布

最近系统学习了大模型Agent Skill相关知识，整理了一份学习大纲，今天就基于这份大纲，和大家详细拆解Agent Skill的核心内容——从基础概念、基本用法，到SKILL.md文件解析、Reference与Script的作用，再到加载机制以及与MCP的核心区别，帮大家彻底搞懂Agent Skill到底是什么、怎么用、核心逻辑是什么。

对于刚接触大模型Agent开发的朋友来说，Agent Skill是提升Agent能力、优化token消耗的关键，掌握它的用法和机制，能让你的Agent更高效、更灵活地处理复杂任务。话不多说，直接进入正题。

一、Agent Skill 核心概念：大模型的“专项技能手册”

首先，我们要明确：Agent Skill 本质是教大模型“如何处理特定任务”的说明文档，它不是可直接运行的程序，而是给大模型提供的“操作指南”，告诉大模型在面对某类任务时，该调用哪些资源、执行哪些步骤、遵循哪些规则。

简单类比：如果把大模型看作一个“通用大脑”，Agent Skill就是这个大脑的“专项技能手册”——比如“文档解析技能手册”“数据上传技能手册”，大脑通过读取手册，就能掌握对应的专项能力，无需每次都重新学习，既节省时间，又减少重复计算。

这里要特别注意一个关键前提：Agent Skill 代码只会被执行，不会被读取。大模型真正读取和理解的，是Skill的描述、指令等说明性内容，而非代码本身，这一点直接决定了后续的加载机制和token消耗逻辑。

二、Agent Skill 基本用法：从文件定义到指令执行

Agent Skill的使用，核心围绕一个关键文件——SKILL.md，所有关于Skill的定义、指令、触发条件，都在这个文件中配置。我们先拆解这个文件的核心结构，再讲具体用法。

2.1 SKILL.md 文件核心结构

SKILL.md 文件分为两大核心部分：元数据（Metadata）和指令（指令层内容），结构清晰，一眼就能看懂，具体如下：

————————

name：skill名称（必须与文件名称相同）

description：描述元数据（Metadata）

————————

# 指令

## 涉及到什么情况时候读取 xx.md （条件触发） Reference（读，消耗token）

遇到什么情况时候运行 xx.py脚本 Script（跑，不占用上下文）

我们逐部分拆解：

（1）元数据层：Skill的“身份卡片”

元数据层只有两个核心字段，也是Skill的基础信息，必须严格配置：

name：Skill的名称，必须与SKILL.md文件名称完全一致（比如文件名叫upload.skill.md，name就必须是upload.skill），这是大模型识别和调用Skill的关键标识，不能出错。
description：Skill的描述，简要说明这个Skill的作用、适用场景，比如“用于处理文件上传任务，当需要上传本地文件至服务器时调用”。这部分是大模型快速了解Skill用途的依据，描述要精准，避免歧义。

元数据层的核心作用是“让大模型知道这个Skill是什么”，是后续加载和调用的基础。

（2）指令层：Skill的“操作指南”

指令层是SKILL.md的核心，主要定义两个关键内容：Reference的触发条件和Script的触发条件，也就是告诉大模型“什么时候读什么资源、什么时候跑什么脚本”。

这里就引出了Agent Skill的两个核心资源：Reference 和 Script，二者的作用、使用场景、token消耗完全不同，必须严格区分：

2.2 Reference：大模型的“参考手册”（读，消耗token）

Reference 本质是“参考资源”，最常见的就是手册.md这类文档，核心作用是：当大模型处理任务时，需要补充特定知识、规则或细节时，读取对应的Reference文档，获取所需信息。

关键特点：

触发方式：按需触发，即“涉及到什么情况时读取”（比如处理订单查询任务时，读取订单规则手册.md），不是默认加载。
token消耗：读取Reference会消耗token，因为大模型需要解析文档内容，将其纳入上下文进行理解和使用。
核心价值：给大模型提供任务所需的“背景知识”，避免大模型因信息不足导致任务处理出错。

2.3 Script：大模型的“工具脚本”（跑，不占用上下文）

Script 本质是“可执行脚本”，比如upload.py，核心作用是：当大模型需要完成特定操作（如文件上传、数据爬取、接口调用）时，运行对应的Script脚本，完成具体动作。

关键特点：

触发方式：按需触发，即“遇到什么情况时运行”（比如需要上传本地文件时，运行upload.py脚本）。
token消耗：运行Script不占用上下文，也不消耗token，因为Script是直接执行的程序，大模型只需要发出“运行指令”，无需解析脚本内容。
核心价值：让大模型具备“执行具体操作”的能力，突破纯文本交互的限制，实现与外部工具的联动。

2.4 基本用法总结

Agent Skill的基本用法，本质是“先定义SKILL.md（配置元数据+指令），再由大模型按需加载、按需调用Reference和Script”，流程如下：

创建SKILL.md文件，配置name（与文件名一致）和description（精准描述）；
在指令层定义Reference的触发条件（什么时候读手册）和Script的触发条件（什么时候跑脚本）；
将Skill文件提交给大模型，大模型根据任务需求，加载对应的内容，完成任务。

三、Agent Skill 核心机制：渐进式披露，极致节省token

很多人使用Agent Skill时，会疑惑：为什么要单独定义Skill，而不是直接把所有资源都传给大模型？核心答案是：按需加载，节省大量token。

大模型的token消耗是核心成本，也是影响响应速度的关键。如果把所有Reference、Script都一次性传给大模型，即使大模型用不到，也会消耗大量token，导致效率低下。而Agent Skill的“渐进式披露”机制，完美解决了这个问题。

所谓“渐进式披露”，就是将Skill的内容分为三个层级，按“从基础到核心、从必须到可选”的顺序，按需加载，具体如下：

3.1 第一层：元数据层（始终加载）

元数据层（name + description）是唯一始终加载的内容，无论大模型是否需要调用这个Skill，都会先加载元数据。

原因很简单：元数据内容极少，消耗的token可以忽略不计，同时能让大模型快速掌握所有可用Skill的“身份信息”，当遇到对应任务时，能快速匹配到对应的Skill，无需逐一检索。

3.2 第二层：指令层（按需加载）

指令层是SKILL.md中除了元数据之外的所有内容（即Reference和Script的触发条件），采用“按需加载”——只有当大模型需要处理对应任务，匹配到该Skill时，才会加载指令层内容。

比如：当大模型需要处理文件上传任务时，才会加载“upload.skill.md”的指令层内容，了解“什么时候跑upload.py脚本”；如果不需要处理文件上传，就不会加载这部分内容，节省token。

3.3 第三层：资源层（按需中的按需加载）

资源层即Reference（手册.md）和Script（upload.py等），是“按需中的按需加载”——只有当大模型加载了指令层，并且触发了对应的条件时，才会加载对应的资源。

举个例子：大模型处理文件上传任务，先加载upload.skill.md的元数据（始终加载），再加载指令层（按需，因为需要处理上传任务），最后只有当触发“需要上传文件”的条件时，才会运行upload.py脚本（资源层，按需中的按需）；如果只是匹配到Skill，但没有触发具体条件，就不会加载资源层，进一步节省token。

机制核心优势

渐进式披露机制的核心价值，就是“精准加载、按需消耗”：只加载大模型当前任务需要的内容，不加载无关内容，最大限度减少token消耗，同时提升大模型的响应速度，让Agent运行更高效。

四、Agent Skill VS MCP：一文分清两个核心概念

学习Agent Skill时，很容易和MCP混淆，很多人分不清二者的区别。其实核心区别很简单，一句话就能概括：MCP给大模型提供数据（本质：程序），Skill教大模型如何处理数据（本质：说明文档）。

我们用表格更清晰地对比二者的核心差异：

对比维度	Agent Skill	MCP
本质	说明文档（教大模型怎么处理数据）	程序（给大模型提供数据）
核心作用	指导大模型处理特定任务，定义操作规则和资源调用条件	向大模型输入数据，为任务处理提供数据支撑
存在形式	以SKILL.md为主的说明性文件	可执行的程序代码（如Python脚本）
token消耗	加载Reference时消耗token，Script运行不消耗	提供数据时会消耗token（数据纳入上下文）
关系	依赖MCP提供的数据，指导大模型处理这些数据	为Skill提供数据支撑，是Skill发挥作用的基础

简单类比：MCP是“食材”（给大模型提供原材料），Agent Skill是“菜谱”（教大模型怎么用食材做菜），二者结合，才能让大模型完成一道“美味的菜”（处理好任务）。

五、学习总结

通过这次学习，我对Agent Skill的理解更清晰了：它不是复杂的程序，而是大模型的“专项技能指南”，核心价值是通过“渐进式披露”机制，让大模型按需加载资源、高效处理任务，同时最大限度节省token。

核心要点回顾：

Agent Skill本质是说明文档，教大模型如何处理数据；
SKILL.md是核心配置文件，包含元数据和指令两层；
Reference（读，耗token）和Script（跑，不耗上下文）是两大核心资源，按需触发；
渐进式披露（元数据始终加载→指令按需加载→资源按需中的按需加载）是核心机制；
与MCP的区别：MCP提供数据（程序），Skill指导处理（说明文档）。

对于刚接触的朋友来说，建议先从编写简单的SKILL.md入手，明确元数据、指令、Reference和Script的配置，再逐步理解渐进式披露机制，结合MCP一起使用，就能快速掌握Agent Skill的核心用法。

龙虾开发者社区

小龙虾开发者社区是 CSDN 旗下专注 OpenClaw 生态的官方阵地，聚焦技能开发、插件实践与部署教程，为开发者提供可直接落地的方案、工具与交流平台，助力高效构建与落地 AI 应用

更多推荐

ollama v0.21.0 最新更新：Hermes Agent 与 Ollama 联动、Copilot CLI 集成、launch 配置优化、Gemma4 与 MLX 多项性能修复全解析

代码地址：github.com/ollama/ollama整体来看，不是一个简单的常规维护版本，而是一次兼顾新集成、新 agent 支持、启动流程优化、模型渲染和缓存修复、性能改进的集中更新。OpenClaw 的 --yes 行为修复云推荐始终优先展示Windows 上显示 WSL 指引Gemma4 多项模板、缓存、渲染、精度修复MLX 的编译、融合、缓存与查找修复create 与 gc race

龙虾开发者社区

为什么 Agent 总是跑偏？从 Prompt Engineering 到 Harness Engineering，一次讲透

龙虾开发者社区

揭秘：AI Agent的规划能力如何突破LLM的局限

AI Agent是一个能够自主行动以实现目标的计算系统。核心要素描述功能感知模块接收和处理环境信息将环境状态转换为内部表示规划模块生成实现目标的行动序列决策制定、目标分解、路径规划记忆模块存储经验、知识和状态保持历史信息、学习和适应执行模块执行规划的行动与环境交互、改变环境状态学习模块从经验中改进性能优化策略、更新知识。