一个问题:为什么 AI Agent 需要「技能」?

你有没有遇到过这种场景——

你让 AI agent 帮你部署一个项目,它很聪明地写出了 Dockerfile,但偏偏不知道你们团队用的是内部 Harbor 镜像仓库,push 的时候永远 401。你让它查数据库,它 SQL 写得漂亮,但不知道你们的数据库连接要走 SSH tunnel。

问题不在于 agent 不够聪明,而在于它缺少特定领域的知识和操作流程

你当然可以每次在 prompt 里手写一遍流程。但这不 scale——团队里每个人都要重复写,换个 agent 平台又得重来。

这就是 Agent Skills 要解决的问题:给 AI agent 一种标准化的方式来获取新能力和专业知识,写一次,到处用。

Agent Skills 是什么?

Agent Skills 是由 Anthropic 主导的开源标准(Apache 2.0 协议),GitHub 上已经有 10.2k stars。它的核心理念非常简单:

一个 Skill 就是一个文件夹,里面包含指令、脚本和资源,agent 可以发现并使用它们来完成特定任务。

没有复杂的协议,没有 gRPC,没有 schema 定义。一个目录 + 一个 Markdown 文件,就是一个 Skill。

和 MCP 什么关系?

这是被问得最多的问题,直接说结论:

Agent Skills MCP
本质 给 agent 的指令和知识 给 agent 的工具接口
格式 Markdown 文档为主 JSON-RPC API 协议
作用 告诉 agent「怎么做」 提供 agent「能调用什么」
类比 操作手册 / SOP 工具箱里的工具

两者是互补的。一个 Skill 可以指导 agent 如何使用某个 MCP server 提供的工具——比如你有一个数据库 MCP server,Skill 可以告诉 agent「查用户表要先关联 user_profile,别忘了加 tenant_id 过滤」。

MCP 解决「有什么工具可用」,Skills 解决「怎么正确地用这些工具」。

规范详解:一个 Skill 长什么样?

一个 Skill 的目录结构非常简洁:

my-deploy-skill/
├── SKILL.md # 必须有,核心文件
├── scripts/ # 可选,可执行脚本
│ └── check-env.sh
├── references/ # 可选,参考文档
│ └── api-docs.md
└── assets/ # 可选,静态资源
└── config-template.yaml

唯一必须存在的文件是 SKILL.md,它由 YAML frontmatter + Markdown 正文组成:

name: harbor-deploy
description: >
使用内部 Harbor 镜像仓库部署容器化应用。
当用户需要构建 Docker 镜像、推送到 Harbor 或部署到 K8s 时使用此 skill。
license: Apache-2.0
compatibility:

  • claude-code
  • cursor
    allowed-tools:
  • bash
  • readFile
  • writeFile

Harbor 部署流程

前置检查

运行 scripts/check-env.sh 确认环境配置。

构建与推送

  1. Dockerfile 必须使用多阶段构建
  2. 镜像 tag 格式:harbor.internal.com/{project}/{name}:{git-sha}
  3. push 前确认已登录:docker login harbor.internal.com

部署到 K8s

使用 references/ 中的模板,替换对应的环境变量…

命名规则

name:小写字母 + 数字 + 连字符,1-64 字符,不能以连字符开头或结尾

description:1-1024 字符,这是路由的关键——agent 靠它来判断要不要激活这个 skill

可选字段

license:开源协议

compatibility:声明兼容哪些平台

metadata:自定义元数据,平台可以用来做 gating、权限控制等

allowed-tools:声明 skill 需要哪些工具权限

运行原理深度解析:渐进式披露

这是 Agent Skills 最精妙的设计——Progressive Disclosure(渐进式披露)

为什么不把所有 skill 的完整内容一股脑塞进 system prompt?因为 context window 是有限的。如果你有 50 个 skill,每个 3000 tokens,光 skills 就占了 150k tokens,agent 还怎么干活?

Agent Skills 的解法是三阶段加载:

第一阶段:Discovery(发现)

Agent 启动

扫描所有 skill 目录

只读取每个 SKILL.md 的 frontmatter(name + description)

注入 system prompt:「你有以下 skills 可用:

  • harbor-deploy: 使用内部 Harbor 镜像仓库部署容器化应用…
  • db-query: 通过 SSH tunnel 查询生产数据库…
  • …」

每个 skill 在这个阶段只消耗约 100 tokens。50 个 skill 也就 5000 tokens,完全可控。

第二阶段:Activation(激活)

当用户说「帮我把这个服务部署到 Harbor」,agent 看到 system prompt 里有 harbor-deploy 这个 skill,description 匹配,于是:

Agent 判断任务匹配 harbor-deploy

调用 loadSkill(“harbor-deploy”)

读取完整 SKILL.md 内容到上下文

Agent 现在知道了完整的操作流程

规范建议 SKILL.md 正文控制在 5000 tokens 以内——够写详细的操作指南了,但不会炸掉 context。

第三阶段:Execution(执行)

Agent 按照 SKILL.md 中的指令开始操作,按需加载 scripts/references/assets/ 中的文件:

Agent 按 SKILL.md 指令操作

需要检查环境?→ 读取并执行 scripts/check-env.sh

需要配置模板?→ 读取 assets/config-template.yaml

需要 API 文档?→ 读取 references/api-docs.md

这个设计的好处在于:agent 永远只加载它当前需要的信息,context 利用率最高。

SDK 集成实战

如果你在开发自己的 AI agent 平台,集成 Agent Skills 并不复杂。以下是基于 ai-sdk.dev 集成指南的 TypeScript 实现思路:

1. 定义 Sandbox 抽象

interface Sandbox {
readFile(path: string): Promise;
writeFile(path: string, content: string): Promise;
exec(command: string): Promise<{ stdout: string; stderr: string }>;
}

Skill 的执行需要文件读写和命令执行能力,这个抽象层让你可以适配不同的运行环境(本地、Docker、云端沙箱)。

2. 启动时扫描并解析 Skills

import { parse as parseYaml } from ‘yaml’;
import { globSync } from ‘glob’;
interface SkillMeta {
name: string;
description: string;
path: string;
}
function discoverSkills(skillDirs: string[]): SkillMeta[] {
const skills: SkillMeta[] = [];
for (const dir of skillDirs) {
const files = globSync(${dir}/\*/SKILL.md);
for (const file of files) {
const content = fs.readFileSync(file, ‘utf-8’);
const frontmatter = extractFrontmatter(content);
const meta = parseYaml(frontmatter);
skills.push({
name: meta.name,
description: meta.description,
path: path.dirname(file),
});
}
}
return skills;
}

3. 注入 System Prompt

function buildSkillsPrompt(skills: SkillMeta[]): string {
const list = skills
.map(s => - ${s.name}: ${s.description})
.join(‘\n’);
return You have the following skills available. When a user's task matches a skill, use the loadSkill tool to load its full instructions.\n\nAvailable skills:\n${list};
}

4. 提供 loadSkill 工具

const loadSkillTool = {
name: ‘loadSkill’,
description: ‘Load the full SKILL.md content for a specific skill’,
parameters: {
type: ‘object’,
properties: {
name: { type: ‘string’, description: ‘Skill name to load’ },
},
required: [‘name’],
},
execute: async ({ name }: { name: string }) => {
const skill = skills.find(s => s.name === name);
if (!skill) return Skill "${name}" not found.;
return fs.readFileSync(${skill.path}/SKILL.md, ‘utf-8’);
},
};

就这样,四步完成核心集成。Agent 启动时发现 skills,用户提问时按需激活,执行时加载具体资源。

各平台支持情况

Agent Skills 目前已有 27+ 个平台集成,覆盖了主流的 AI coding 和 agent 工具:

IDE / 编辑器插件: VS Code、Cursor、GitHub Copilot

CLI 工具: Claude Code、OpenAI Codex CLI、Gemini CLI、Goose、OpenCode、Amp

框架 / 平台: Spring AI、Roo Code、Factory、Databricks

其他: 还有一众社区实现持续增加中

这个生态增长速度很快,主要得益于规范本身的简洁——你不需要实现复杂的协议,本质上就是「读 Markdown + 注入 prompt」。

实战:写一个自己的 Skill

来写一个简单但实用的 Skill——帮助 agent 正确地操作你团队的 Git 工作流:

mkdir git-workflow && cd git-workflow

创建 SKILL.md

name: git-workflow
description: >
团队 Git 工作流规范。当用户需要创建分支、提交代码、
发起 PR 或处理 merge conflict 时使用此 skill。

Git 工作流

分支命名

  • 功能分支:feat/{jira-id}-{简短描述}
  • 修复分支:fix/{jira-id}-{简短描述}
  • 发布分支:release/v{x.y.z}

提交规范

使用 Conventional Commits:

  • feat: 新功能
  • fix: 修复
  • docs: 文档
  • refactor: 重构
    提交前必须运行 scripts/pre-commit-check.sh

PR 流程

  1. 确保 CI 通过
  2. 至少需要 1 个 reviewer approve
  3. squash merge 到 main
  4. 删除远程分支

然后在 scripts/pre-commit-check.sh 中放入检查逻辑:

#!/bin/bash
echo “Running lint…”
npm run lint || exit 1
echo “Running tests…”
npm test || exit 1
echo “All checks passed ✅”

把这个目录放到你的项目根目录或 ~/.openclaw/skills/ 下,agent 就能自动发现并使用它了。

一些进阶实现:以 OpenClaw 为例

不同平台在 Agent Skills 规范之上会有自己的扩展实现。以 OpenClaw 为例,它做了这些增强:

三级加载优先级:

bundled skills(内置)→ ~/.openclaw/skills(用户级)→ workspace/skills(项目级)

优先级递增,项目级 skill 可以覆盖同名的用户级或内置 skill。

Gating 机制: 通过 metadata.openclaw.requires 字段,skill 可以声明自己需要的前置条件(命令行工具、环境变量、配置项),不满足条件的 skill 不会被加载。

环境注入: Agent 运行时自动注入 skill 声明的环境变量和 API key,运行结束后恢复原始环境——避免 skill 之间的环境污染。

Skills Watcher: 文件变化自动刷新,改了 SKILL.md 不需要重启 agent。

ClawHub: 公共 skills 注册中心,类似 npm registry,可以发布和安装社区 skills。

这些都是标准之上的增值实现,但核心依然遵循 Agent Skills 规范。

总结与展望

Agent Skills 的设计哲学可以用一句话概括:用最简单的格式解决最实际的问题。

它没有发明新的协议,而是复用了开发者最熟悉的东西——Markdown 和文件系统。一个目录、一个 SKILL.md,就能让 agent 学会新技能。渐进式披露的路由机制保证了 context 效率,而开放的标准让 skill 可以跨平台复用。

目前 Agent Skills 还处于早期发展阶段,但几个趋势已经比较明确:

  1. 生态快速增长:27+ 平台支持只是开始,随着 AI agent 的普及,Skills 生态会像 npm 包一样爆发

  2. 与 MCP 的融合:Skills + MCP 的组合会成为 agent 能力扩展的标配——一个提供知识,一个提供工具

  3. 企业级实践:团队的内部规范、操作流程、最佳实践,都可以沉淀为 Skills,成为组织的 AI 知识资产

如果你正在构建 AI agent 相关的产品,或者想让你团队的 agent 更聪明,现在就可以开始写你的第一个 Skill 了。

想入门 AI 大模型却找不到清晰方向?备考大厂 AI 岗还在四处搜集零散资料?别再浪费时间啦!2026 年 AI 大模型全套学习资料已整理完毕,从学习路线到面试真题,从工具教程到行业报告,一站式覆盖你的所有需求,现在全部免费分享

👇👇扫码免费领取全部内容👇👇

一、学习必备:100+本大模型电子书+26 份行业报告 + 600+ 套技术PPT,帮你看透 AI 趋势

想了解大模型的行业动态、商业落地案例?大模型电子书?这份资料帮你站在 “行业高度” 学 AI

1. 100+本大模型方向电子书

在这里插入图片描述

2. 26 份行业研究报告:覆盖多领域实践与趋势

报告包含阿里、DeepSeek 等权威机构发布的核心内容,涵盖:

  • 职业趋势:《AI + 职业趋势报告》《中国 AI 人才粮仓模型解析》;
  • 商业落地:《生成式 AI 商业落地白皮书》《AI Agent 应用落地技术白皮书》;
  • 领域细分:《AGI 在金融领域的应用报告》《AI GC 实践案例集》;
  • 行业监测:《2024 年中国大模型季度监测报告》《2025 年中国技术市场发展趋势》。

3. 600+套技术大会 PPT:听行业大咖讲实战

PPT 整理自 2024-2025 年热门技术大会,包含百度、腾讯、字节等企业的一线实践:

在这里插入图片描述

  • 安全方向:《端侧大模型的安全建设》《大模型驱动安全升级(腾讯代码安全实践)》;
  • 产品与创新:《大模型产品如何创新与创收》《AI 时代的新范式:构建 AI 产品》;
  • 多模态与 Agent:《Step-Video 开源模型(视频生成进展)》《Agentic RAG 的现在与未来》;
  • 工程落地:《从原型到生产:AgentOps 加速字节 AI 应用落地》《智能代码助手 CodeFuse 的架构设计》。

二、求职必看:大厂 AI 岗面试 “弹药库”,300 + 真题 + 107 道面经直接抱走

想冲字节、腾讯、阿里、蔚来等大厂 AI 岗?这份面试资料帮你提前 “押题”,拒绝临场慌!

1. 107 道大厂面经:覆盖 Prompt、RAG、大模型应用工程师等热门岗位

面经整理自 2021-2025 年真实面试场景,包含 TPlink、字节、腾讯、蔚来、虾皮、中兴、科大讯飞、京东等企业的高频考题,每道题都附带思路解析

2. 102 道 AI 大模型真题:直击大模型核心考点

针对大模型专属考题,从概念到实践全面覆盖,帮你理清底层逻辑:

3. 97 道 LLMs 真题:聚焦大型语言模型高频问题

专门拆解 LLMs 的核心痛点与解决方案,比如让很多人头疼的 “复读机问题”:


三、路线必明: AI 大模型学习路线图,1 张图理清核心内容

刚接触 AI 大模型,不知道该从哪学起?这份「AI大模型 学习路线图」直接帮你划重点,不用再盲目摸索!

在这里插入图片描述

路线图涵盖 5 大核心板块,从基础到进阶层层递进:一步步带你从入门到进阶,从理论到实战。

img

L1阶段:启航篇丨极速破界AI新时代

L1阶段:了解大模型的基础知识,以及大模型在各个行业的应用和分析,学习理解大模型的核心原理、关键技术以及大模型应用场景。

img

L2阶段:攻坚篇丨RAG开发实战工坊

L2阶段:AI大模型RAG应用开发工程,主要学习RAG检索增强生成:包括Naive RAG、Advanced-RAG以及RAG性能评估,还有GraphRAG在内的多个RAG热门项目的分析。

img

L3阶段:跃迁篇丨Agent智能体架构设计

L3阶段:大模型Agent应用架构进阶实现,主要学习LangChain、 LIamaIndex框架,也会学习到AutoGPT、 MetaGPT等多Agent系统,打造Agent智能体。

img

L4阶段:精进篇丨模型微调与私有化部署

L4阶段:大模型的微调和私有化部署,更加深入的探讨Transformer架构,学习大模型的微调技术,利用DeepSpeed、Lamam Factory等工具快速进行模型微调,并通过Ollama、vLLM等推理部署框架,实现模型的快速部署。

img

L5阶段:专题集丨特训篇 【录播课】

img
四、资料领取:全套内容免费抱走,学 AI 不用再找第二份

不管你是 0 基础想入门 AI 大模型,还是有基础想冲刺大厂、了解行业趋势,这份资料都能满足你!
现在只需按照提示操作,就能免费领取:

👇👇扫码免费领取全部内容👇👇

2026 年想抓住 AI 大模型的风口?别犹豫,这份免费资料就是你的 “起跑线”!

Logo

小龙虾开发者社区是 CSDN 旗下专注 OpenClaw 生态的官方阵地,聚焦技能开发、插件实践与部署教程,为开发者提供可直接落地的方案、工具与交流平台,助力高效构建与落地 AI 应用

更多推荐