MCP 与 Agent Skill：AI 走向行动时代的「双手」与「大脑」

AI正从"聊天时代"迈向"行动时代"，MCP和Agent Skill成为两大关键技术支柱。MCP作为标准化协议，解决AI连接外部系统的问题，类似USB-C接口统一设备连接；Agent Skill则提供结构化操作指南，规范AI执行流程。二者协同工作：MCP赋予AI"双手"连接工具，Agent Skill提供"大脑"操作手

studyer_domi

299人浏览 · 2026-05-10 15:23:04

studyer_domi · 2026-05-10 15:23:04 发布

MCP 与 Agent Skill：AI 走向行动时代的「双手」与「大脑」

2026 年，AI 正从"聊天时代"迈向"行动时代"。用户不再满足于一个只会回答问题的 AI，而是需要一个能理解任务、调用工具、执行操作并交付结果的智能代理。而支撑这一范式转移的两大技术支柱，就是 MCP 和 Agent Skill。

🤔 一个问题引入：AI 为什么还不会"干活"？

你有没有过这样的体验——

让 AI 帮你查公司数据库里的销售数据，它说"我无法访问外部系统"；让 AI 按照财务审批流程处理一笔报销，它胡乱编造了一个流程；让 AI 同时操作 5 个工具完成一个复杂任务，它不是忘了这一步就是搞混了那一步。

问题出在哪？两个核心痛点：

AI 连不上外部世界——它被困在"聊天框"里，摸不到你的数据、系统和工具
AI 不会规范地干活——即便给了它工具，它也经常用错顺序、遗漏步骤、不守规矩

MCP 解决第一个问题，Agent Skill 解决第二个问题。

一个是「手」，一个是「操作手册」——缺一不可。

🔌 MCP：AI 的 USB-C 接口

什么是 MCP？

MCP（Model Context Protocol，模型上下文协议） 是由 Anthropic 于 2024 年 11 月发布的开放标准，2025 年 12 月捐赠给 Linux 基金会旗下的 Agentic AI Foundation，18 个月内便获得了 OpenAI、Google、Microsoft 等巨头的支持。

它要做的事很简单——让 AI 能标准化地连接外部世界。

一个类比你就懂

💡 MCP 就像电子设备的 USB-C 接口。在 USB-C 出现之前，每个设备都有自己的充电线和数据接口，互不兼容。USB-C 统一了这一切——一根线，连所有设备。MCP 做的是同样的事：一个协议，连所有外部系统。

┌──────────┐    MCP 协议     ┌──────────────┐
│          │ ◄════════════► │   数据库      │
│  AI 模型  │    (JSON-RPC)   │   文件系统    │
│ (客户端)  │ ◄════════════► │   API 服务    │
│          │                │   云存储      │
└──────────┘                └──────────────┘

MCP 暴露三大能力

能力类型	作用	典型示例
🔧 Tools（工具）	让 AI 执行操作	发送消息、创建工单、调用 API
📄 Resources（资源）	让 AI 读取数据	读取数据库记录、文件内容
📋 Prompts（提示模板）	提供预置工作流模板	代码审查模板、报告生成模板

MCP 的核心价值

一次配置，到处可用：同一个 MCP Server 可以被 Claude、ChatGPT、Cursor、VS Code 等所有支持 MCP 的客户端使用
标准化通信：基于 JSON-RPC 2.0 协议，任何语言都能实现
安全可控：协议层面定义了权限控制、数据隔离和操作审计机制

MCP 典型连接场景

你的 AI 助手
    │
    ├──► MCP Server: 数据库 ──► 查询销售记录
    ├──► MCP Server: GitHub  ──► 提交代码、创建 PR
    ├──► MCP Server: 飞书    ──► 发送群消息
    └──► MCP Server: 文件系统 ──► 读写本地文件

📖 Agent Skill：AI 的专业操作手册

什么是 Agent Skill？

如果说 MCP 是给 AI 装「手」，那 Agent Skill 就是给 AI 递一本「操作手册」。

Agent Skill 本质是一个 Markdown 文件（SKILL.md），用 YAML 格式标注名称和描述，正文写操作指南。它告诉 AI：遇到某类任务时，应该按照什么步骤、遵守什么规则来执行。

---
name: refund-handler          # 技能名称
description: 处理退款申请       # 简短描述
---

# 退款处理流程

当用户申请退款时：
1. 核实订单号和购买时间
2. 如果在 7 天内，直接批准
3. 如果超过 7 天，转人工审核
4. 回复用户预计到账时间

为什么需要 Agent Skill？

你可能会问：直接在提示词里写规则不就行了？

问题是——

痛点	提示词	Agent Skill
每次都要手动输入	✅ 是	❌ 自动加载
内容太长导致 AI 注意力分散	✅ 会	❌ 渐进式加载
无法跨对话复用	✅ 无法	❌ 永久可用
难以团队共享	✅ 难	❌ 文件即分享

Skill 的三层加载机制

Agent Skill 最精妙的设计是 渐进式披露（Progressive Disclosure）——就像一本书，先看目录，需要时再翻正文和附录：

┌─────────────────────────────────────────┐
│  📑 元数据层 (Metadata) —— 始终加载      │
│  只有名称和描述，极轻量                    │
│  → 类比：书的目录                         │
├─────────────────────────────────────────┤
│  📝 指令层 (Instructions) —— 按需加载     │
│  具体执行规则和步骤                        │
│  → 类比：书的正文                         │
├─────────────────────────────────────────┤
│  🔧 资源层 (Resources) —— 按需中的按需     │
│  Reference 文档、Script 脚本              │
│  → 类比：书的附录                         │
└─────────────────────────────────────────┘

好处是什么？ 初始上下文极简，只有一小段描述。AI 判断需要这个 Skill 时，才拉取完整内容。长对话场景下，Token 消耗优势巨大。

两大高级功能

功能	说明	场景
🔗 Reference	条件触发的按需加载	财务手册、法规文档——不常用但需要精准调用
⚡ Script	直接执行代码而非读取文档	文件处理、数据计算——几乎不占上下文

🤝 MCP + Agent Skill：不是对手，是搭档

核心区别

维度	MCP	Agent Skill
本质	开放通信协议	结构化 Prompt + 流程包
解决什么	AI 能不能做（Access）	AI 怎么做好（Workflow）
比喻	USB 接口 / 手	操作手册 / SOP
定义者	工具提供方（开发者）	业务方（产品经理、业务专家）
加载方式	工具描述常驻上下文	渐进式披露，按需加载
Token 消耗	工具多时容易爆炸	初始极简，长对话优势明显
标准化	高（开放协议，跨模型）	中等（Claude 最成熟，生态扩展中）

一个生活化比喻

想象你开了一家外卖店，雇了一个新员工——

概念	比喻
提示词	你对员工说的指令：“去处理一下那个退款”
Agent Skill	员工手边的操作手册：“退款处理 SOP”
MCP	员工能用的工具：电话、收银机、外卖平台后台
Agent	员工本人——能自主思考、决策、行动

🔴 只有 MCP（只给工具） → 员工有手但不知道流程，可能会乱操作
🔴 只有 Skill（只给手册） → 员工知道步骤但连不上系统，打不开外卖平台
🟢 两者都有 → 员工能独立、高质量地完成复杂任务

最佳实践：Skill 调用 MCP

大多数生产级 Agent 最终都采用 Skill 调用 MCP 的组合架构：

用户指令（提示词）
      │
      ▼
   Agent（智能代理）
      ├── 加载 Skill（查阅操作手册）
      │     └── "先查数据库 → 再发通知 → 最后记录日志"
      └── 调用 MCP（使用工具）
            ├── MCP Server: 数据库 ──► 查询数据
            ├── MCP Server: 飞书   ──► 发送通知
            └── MCP Server: 日志   ──► 写入记录

Skill 规定了"先做什么、后做什么、什么条件下怎么做"，MCP 提供了"做到每一步时用什么工具"。

🎯 什么时候用哪个？

场景	优先选择	原因
AI 需要访问外部数据/API/工具	MCP	没有连接，一切免谈
AI 乱用工具、步骤错乱、格式不对	Agent Skill	用 Skill 规范流程、加判断逻辑
Token 消耗太大、上下文塞满工具描述	Agent Skill	渐进加载，初始上下文极简
企业复杂业务流程（财务/法务/HR）	Skill + MCP	流程用 Skill 封装，底层工具用 MCP
跨模型/跨团队复用工具	MCP	协议标准化，即插即用
快速原型、个人使用	Agent Skill	开发成本极低，几分钟写个 md

🔮 趋势与展望

MCP 生态加速扩张

2025 年 12 月，MCP 捐赠给 Linux 基金会，成立 Agentic AI Foundation
OpenAI、Google、Microsoft 三巨头均已支持 MCP
2026 年路线图：触发器/Webhook 支持、流式传输、更完善的安全审计

Agent Skill 规范化

agentskills.io 推动跨平台 Skill 规范
Claude Code、Cursor、Codex、Opencode 等主流 AI 编程工具陆续支持
三层渐进式加载成为行业共识

融合才是终局

“MCP 是给 AI 发枪发子弹，Agent Skill 是教 AI 怎么开枪、打什么靶、遵守什么规则。”

未来的 AI Agent 系统不会只依赖其中之一。就像一个优秀的员工，既需要工具也需要培训——MCP 提供能力，Skill 提供方法论，Agent 负责执行。

📝 总结一张图

┌──────────────────────────────────────────────────┐
│                                                  │
│   你用提示词告诉 Agent 做什么                      │
│         │                                        │
│         ▼                                        │
│      Agent（自主行动的 AI）                        │
│      ┌─────┴─────┐                               │
│      │           │                               │
│      ▼           ▼                               │
│   Skill        MCP                               │
│  (操作手册)   (工具连接)                           │
│  "怎么做"     "用什么做"                           │
│      │           │                               │
│      └─────┬─────┘                               │
│            ▼                                     │
│     高质量完成复杂任务                              │
│                                                  │
└──────────────────────────────────────────────────┘

一句话总结：MCP 解决 AI「能不能做」的问题，Agent Skill 解决 AI「怎么做好」的问题。两者不是替代关系，而是上下层互补关系——这才是 AI Agent 走向工程化的正确姿势。

参考资料：