一篇文章读懂AI-Agent-MCP-Skills

Skills = AI的"App Store"想想你的智能手机。只有一个基本操作系统，但可以安装各种App——相机、微信、地图、游戏。想要什么功能，就装什么App，不用的可以卸载，App可以分享给朋友。Claude Skills就是Claude的"App"。Claude本体 = 只会聊天的AIClaude + Skills = 会干活的超级AIClaude + 代码审查Skill = 代码审查专家

Violet1231_

728人浏览 · 2026-02-02 21:55:09

Violet1231_ · 2026-02-02 21:55:09 发布

一篇文章读懂AI Agent、MCP、Skills

2025年被称为"Agent元年"，AI正在从"思考"走向"行动"。

引言：从"能说的AI"到"能干的AI"

先看两个场景。

场景一：你让ChatGPT帮你写一段Python代码，它写得很好。但接下来，你说"帮我把它保存到我的项目文件夹，然后用Git提交到GitHub"，ChatGPT只能回答：“我不能直接操作你的文件系统，你需要手动操作…”

场景二：你希望有一个AI助手，不仅能和你聊天，还能真正帮你干活——读取文件、调用API、操作数据库、部署应用、发送邮件。

这就是AI Agent要解决的问题。而要实现这样的AI，需要三大支柱技术：

AI Agent——让AI有"手脚"，能真正行动
MCP（Model Context Protocol）——让AI和工具之间有"通用语言"
Claude Skills——让AI的能力像"技能包"一样可以随时装备

在这里插入图片描述

一、AI Agent：从"聊天机器人"到"数字员工"

1.1 用一个比喻理解AI Agent

传统聊天机器人就像一个只能说话的电话客服。你问问题，它回答问题，但它只能用语言交流，不能实际操作任何东西，每次对话都是新的开始。

AI Agent就像一个真实的办公室助理。不仅能回答问题，还能实际干活——帮你整理文件、发邮件、做表格，记得之前的对话内容，会主动思考和规划如何完成任务。

1.2 从技术角度看：AI Agent的四个核心组件

如果用人体来做比喻，AI Agent由四个部分组成：

┌─────────────────────────────────────────┐
│           AI Agent 的"身体"              │
├─────────────────────────────────────────┤
│                                         │
│   LLM (大脑)     规划器                 │
│      理解语言  →    拆解任务             │
│                                         │
│   记忆        工具箱                    │
│      记住信息  ↔    调用API/服务         │
│                                         │
│   执行器                                │
│      实际执行操作                        │
│                                         │
└─────────────────────────────────────────┘

LLM（大脑）——理解和思考

LLM就是像GPT-4、Claude这样的大语言模型。它负责理解你说的话，分析问题的本质，生成合理的回答。LLM就像一个人的大脑，负责思考和语言理解。

记忆——记住上下文

AI Agent需要记住之前对话的内容、任务的中间状态、已经尝试过的方法、用户偏好和习惯。记忆就像一个人的笔记本，随时记录和查阅重要信息。

实际例子：

用户：帮我看看昨天那个项目的bug修好了吗？

AI Agent（有记忆）：
知道"昨天"指的是哪一天
知道"那个项目"是哪个项目
记得之前讨论过什么bug

没有记忆的AI只能问："你说的是哪个项目？"

工具箱——实际行动的能力

这是AI Agent和传统聊天机器人最大的区别。AI Agent可以调用各种工具：读取和写入文件、调用网络API、查询数据库、执行系统命令、发送邮件和消息。工具就像一个人的手脚，让它能够实际操作世界。

规划器——拆解和规划

面对复杂任务，AI Agent需要把大任务拆成小步骤，决定先做什么、后做什么，根据执行结果调整计划，处理意外情况。规划器就像一个人的执行力，知道如何一步步完成目标。

1.3 看个实际例子

假设你对AI Agent说：“帮我分析这个月的销售数据，找出表现最好的产品，然后生成一份报告发送给老板”

传统聊天机器人只能提供指导，告诉你如何用Excel分析数据，但无法实际执行。

AI Agent会经历完整的执行过程：

理解任务（LLM）：需要数据分析+邮件发送
查询记忆：销售数据在哪？老板邮箱是什么？
规划步骤：读取文件→分析数据→生成报告→发送邮件
逐步执行：调用相应的工具完成任务
完成并反馈结果

在这里插入图片描述

1.4 为什么需要AI Agent？

传统AI只能对话，不能行动。每次都要重新输入背景信息，无法完成多步骤任务，需要人工在AI和工具之间"传话"。

AI Agent能够真正完成工作，而不只是提供建议。它记住上下文，对话更自然，可以自主完成复杂任务，相当于24/7待命的数字员工。

现实应用场景：

开发助手：帮你写代码、运行测试、部署应用
数据分析：自动从数据库提取数据、生成图表、写报告
客服机器人：不仅能回答问题，还能直接查询订单、办理退款
个人助理：管理日程、回复邮件、整理文件

二、MCP：让AI和工具说同一种语言

2.1 MCP解决什么问题？

在MCP出现之前，让AI使用工具有一个大问题：每个工具都有自己的"方言"。

想象一下，你要和不同国家的人合作。法国人说法语，日本人说日语，德国人说德语。如果你想让他们合作，你需要学会三种语言，每次说话都要切换语言，非常麻烦且容易出错。

AI世界也有同样的问题。Claude用自己的格式，ChatGPT用自己的格式，Gemini用自己的格式，每个工具也都有自己的API格式。结果就是开发者要为每个AI重复开发，工具无法在不同AI间复用，每次集成都要重新学习。

MCP（Model Context Protocol）就是"AI世界的英语"——统一的通信标准，所有AI都学会这个标准，所有工具都支持这个标准，一次开发，到处使用。

2.2 MCP是什么？（用USB做比喻）

MCP = AI世界的USB标准

还记得以前每个手机都有自己专用的充电器吗？诺基亚用诺基亚的充电器，三星用三星的充电器，摩托罗拉用摩托罗拉的充电器，出门要带一堆充电器，非常麻烦。

后来有了USB标准。所有设备都用同样的接口，一根线可以给所有设备充电，简单、统一、方便。

MCP就是让AI和工具"即插即用"的标准。

没有MCP的世界：
┌──────────┐          ┌──────────┐
│   Claude │---特殊格式1→│  文件工具  │
└──────────┘          └──────────┘

┌──────────┐          ┌──────────┐
│  ChatGPT │---特殊格式2→│  文件工具  │
└──────────┘          └──────────┘

有MCP的世界：
┌──────────┐          ┌──────────┐          ┌──────────┐
│   Claude │          │  ChatGPT │          │  Gemini  │
└─────┬────┘          └─────┬────┘          └─────┬────┘
      │                     │                     │
      └─────────────────────┼─────────────────────┘
                            │
                    ┌───────▼────────┐
                    │       MCP       │
                    │   通用接口      │
                    └───────┬────────┘
                            │
      ┌─────────────────────┼─────────────────────┐
      ↓                     ↓                     ↓
┌──────────┐          ┌──────────┐          ┌──────────┐
│ 文件系统  │          │  数据库   │          │  Web API │
│ 服务器   │          │  服务器   │          │  服务器   │
└──────────┘          └──────────┘          └──────────┘

2.3 MCP的工作原理

MCP的通信过程就像在餐厅点菜。你坐下后，服务员给你菜单，你点菜提出需求，服务员把订单送到厨房（工具服务器），厨师做菜执行操作，最后服务员把菜端给你返回结果。

在MCP的世界里：

你启动Claude
Claude读取.mcp.json配置（就像看菜单）
你说：“帮我读取文件X”
Claude连接MCP服务器
握手阶段：Claude问"你是谁？你能做什么？“，服务器回答"我是文件系统服务器，我可以读写文件”
Claude调用工具：“请读取文件X”
服务器执行操作，返回结果
Claude处理结果，回复你

在这里插入图片描述

2.4 MCP的核心特性

标准化的对话格式

MCP使用JSON-RPC格式，就像所有人都用同一种语言交流。无论哪个AI，想读取文件都要用统一的格式。

资源与工具分离

MCP区分两种东西：

资源 = 数据。类比餐厅的食材，例子包括文件、数据库记录、API返回的数据。

工具 = 操作。类比厨师的烹饪技巧，例子包括读取文件、查询数据库、发送HTTP请求。

双向实时通信

MCP支持多种通信方式：stdio适合本地工具，SSE适合实时更新，WebSocket适合复杂交互。

2.5 MCP的实际应用例子

例子1：文件系统服务器

# .mcp.json 配置
{
  "mcpServers": {
    "filesystem": {
      "command": "npx",
      "args": ["-y", "@modelcontextprotocol/server-filesystem", "C:/Users/admin/Documents"]
    }
  }
}

现在Claude可以读取你Documents文件夹的文件，创建新文件，搜索文件内容，列出目录结构。

例子2：数据库服务器

{
  "mcpServers": {
    "postgres": {
      "command": "node",
      "args": ["mcp-postgres-server/index.js"]
    }
  }
}

现在Claude可以执行SQL查询，读取数据库表结构，插入和更新数据。

2.6 为什么MCP很重要？

对开发者来说，写一次工具，所有AI都能用。不需要为每个AI单独适配，专注业务逻辑，不用操心通信细节。

对用户来说，不同AI都能访问相同的工具，更容易扩展AI的能力，工具生态更丰富。

对整个行业来说，推动标准化，降低开发门槛，加速AI应用创新。

三、Claude Skills：让AI的能力像"装备"一样

3.1 Skills解决什么问题？

想象你在玩游戏。没有技能系统的游戏，角色一开始就固定了所有能力，想换玩法只能重新创建角色，不同角色的能力无法共享，每次都要从头练起。

有技能系统的游戏，可以学习和装备不同的技能，随时更换技能搭配，技能可以在角色间共享，想换玩法换套技能就行。

Claude Skills就是AI的"技能系统"。

3.2 什么是Skills？

Skills = AI的"App Store"

想想你的智能手机。只有一个基本操作系统，但可以安装各种App——相机、微信、地图、游戏。想要什么功能，就装什么App，不用的可以卸载，App可以分享给朋友。

Claude Skills就是Claude的"App"。

Claude本体 = 只会聊天的AI

Claude + Skills = 会干活的超级AI

例如：

Claude + 代码审查Skill = 代码审查专家
Claude + 数据分析Skill = 数据分析师
Claude + 文档写作Skill = 技术写作专家
Claude + 翻译Skill = 专业翻译

3.3 Skills vs 其他机制

Claude之前有几种扩展AI能力的方式，但都有局限。

机制	比喻	优点	缺点
Rules	系统设置	简单直接	只能用于单个项目，只能写静态规则
Commands	快捷键	一键执行固定操作	操作写死，不能灵活变化，每个项目都要重新配置
MCP Servers	外设	可以连接外部工具	需要写完整的代码，偏技术，普通用户难以上手
Skills	App	动态加载上下文，可以分享，即装即用，可以组合使用	学习曲线

3.4 Skills的核心特性

动态上下文加载

Skills可以根据需要加载不同的"知识库"和"规则"。就像换装备，每套装备适合不同的场景。

人设与能力分离

Skills把"角色"和"技能"分开管理。就像演戏，同一个演员（Claude）可以扮演不同的角色（医生、律师、老师），每个角色有自己的专业知识和说话方式。

Hooks生命周期钩子

Skills可以在特定时机自动触发某些行为。就像游戏的自动触发技能，满足条件就自动发动。

// 代码审查Skill的Hooks
hooks: {
  // 你要写代码时，自动检查规范
  beforeWrite: "检查代码是否符合团队规范",

  // 你修改完代码后，自动建议测试
  afterEdit: "建议添加哪些测试用例",

  // 出错时，自动提供修复建议
  onError: "分析错误原因并提供解决方案"
}

在这里插入图片描述

3.5 Skills的实际应用例子

例子1：代码生成Skill

场景：你想让Claude帮你写代码，但要符合你们团队的风格。

传统方式：每次对话都要说"请用Python写一个函数，要符合我们团队的风格：用Type Hints，添加docstring，错误要抛出自定义异常，命名用snake_case…"

用Skills：创建一个python-developer Skill，配置团队的编码规范、项目最佳实践、常用代码模板。Claude会自动按照规范写代码，不用每次重复说明。

例子2：文档写作Skill

创建tech-writer Skill，加载文档模板、写作规范、常用术语表。Claude会按照规范生成技术文档。

例子3：数据分析师Skill

创建data-analyst Skill，通过MCP连接数据库和pandas，加载分析方法论、常用图表类型、业务指标定义。Claude会按照工作流程完成数据分析任务。

3.6 Skills如何让AI更强大？

专业化：每个Skill专注于一个领域，深度优化，效果更好，可以不断迭代更新。

可组合：同时激活多个Skill，Skills之间可以协作，像搭积木一样组合能力。

可分享：开发者可以发布自己的Skill，用户可以安装使用，形成Skill生态系统。

可进化：Skill可以独立更新，用户反馈可以快速融入，持续改进。

四、三者如何协作：完整的实战案例

4.1 演进时间线

这三大技术是如何逐步发展的？

2023年        2024年上半年        2024年底        2025年
  │              │                │              │
  ↓              ↓                ↓              ↓
LLM爆发    →   Agent探索    →   MCP诞生    →   Skills推出
(能说话)      (能干活)       (统一语言)      (可装备)

像这样：
宝宝会说话  →  会做家务    →  发明通用语言  →  发明技能书

4.2 技术栈对比：新旧两种方式

2024年做法（没有MCP和Skills）：每次都要手动定义工具，每个AI要用不同的API调用方式，每个用户的偏好都要在对话中说明。

2025年做法（有MCP和Skills）：

第一步：配置MCP服务器（一次配置，所有AI都能用）

第二步：安装别人写好的Skill，直接使用

第三步：直接开始工作

在这里插入图片描述

4.3 完整协作案例：自动化代码审查流程

需求：创建一个AI助手，能够自动审查代码并提交修复建议。

第1步：配置MCP（连接工具）

# .mcp.json
{
  "mcpServers": {
    "filesystem": {
      "command": "npx",
      "args": ["-y", "@modelcontextprotocol/server-filesystem", "./src"]
    },
    "github": {
      "command": "npx",
      "args": ["-y", "@modelcontextprotocol/server-github"],
      "env": {
        "GITHUB_TOKEN": "你的GitHub令牌"
      }
    }
  }
}

MCP的作用：filesystem服务器让Claude能读取代码文件，github服务器让Claude能创建PR和Issue。

第2步：创建Skill（定义能力）

# skill: code-reviewer
name: 代码审查专家
description: 自动审查代码质量并提供修复建议

persona:
  角色: 资深代码审查专家
  语气: 建设性、友好、专业
  原则: 先说好的，再提改进建议

context_files:
  - coding-standards.md
  - common-issues.md
  - best-practices.md

hooks:
  afterReadFile:
    - 检查文件编码规范
    - 检查潜在安全问题
    - 检查性能问题

required_mcp_tools:
  - filesystem.read
  - filesystem.write
  - github.pr

Skills的作用：定义了"如何审查"的知识和规则，规定了审查的流程和标准，在适当时机自动触发检查。

第3步：AI Agent执行（实际干活）

现在你只需要说：“帮我审查 src/user.py 这个文件”

AI Agent的执行过程：

理解需求：用户想审查 src/user.py
检查可用的能力（Skill加载）：code-reviewer Skill已激活，知道要用Python编码规范审查
制定计划：读取文件内容→按标准检查代码→生成审查报告→创建PR提交建议
执行步骤1（MCP调用）：调用 filesystem.read 读取 src/user.py
分析代码（LLM + Skill知识）：加载编码规范，应用检查清单，逐行审查代码
生成报告：发现3个问题——缺少类型注解、SQL查询有注入风险、变量名不规范
执行步骤4（MCP调用）：调用 github.pr 创建PR
完成：报告审查结果，提供PR链接

在这里插入图片描述

4.4 三者分工总结

组件	角色	比喻	在例子中的作用
AI Agent	执行主体	员工	理解需求、规划步骤、执行任务、协调资源
MCP	通信协议	标准接口	让Claude能连接文件系统和GitHub
Skills	能力模块	技能包	提供代码审查的知识和规则