一篇文章读懂AI-Agent-MCP-Skills
Skills = AI的"App Store"想想你的智能手机。只有一个基本操作系统,但可以安装各种App——相机、微信、地图、游戏。想要什么功能,就装什么App,不用的可以卸载,App可以分享给朋友。Claude Skills就是Claude的"App"。Claude本体 = 只会聊天的AIClaude + Skills = 会干活的超级AIClaude + 代码审查Skill = 代码审查专家
一篇文章读懂AI Agent、MCP、Skills
2025年被称为"Agent元年",AI正在从"思考"走向"行动"。
引言:从"能说的AI"到"能干的AI"
先看两个场景。
场景一:你让ChatGPT帮你写一段Python代码,它写得很好。但接下来,你说"帮我把它保存到我的项目文件夹,然后用Git提交到GitHub",ChatGPT只能回答:“我不能直接操作你的文件系统,你需要手动操作…”
场景二:你希望有一个AI助手,不仅能和你聊天,还能真正帮你干活——读取文件、调用API、操作数据库、部署应用、发送邮件。
这就是AI Agent要解决的问题。而要实现这样的AI,需要三大支柱技术:
- AI Agent——让AI有"手脚",能真正行动
- MCP(Model Context Protocol)——让AI和工具之间有"通用语言"
- Claude Skills——让AI的能力像"技能包"一样可以随时装备

一、AI Agent:从"聊天机器人"到"数字员工"
1.1 用一个比喻理解AI Agent
传统聊天机器人就像一个只能说话的电话客服。你问问题,它回答问题,但它只能用语言交流,不能实际操作任何东西,每次对话都是新的开始。
AI Agent就像一个真实的办公室助理。不仅能回答问题,还能实际干活——帮你整理文件、发邮件、做表格,记得之前的对话内容,会主动思考和规划如何完成任务。
1.2 从技术角度看:AI Agent的四个核心组件
如果用人体来做比喻,AI Agent由四个部分组成:
┌─────────────────────────────────────────┐
│ AI Agent 的"身体" │
├─────────────────────────────────────────┤
│ │
│ LLM (大脑) 规划器 │
│ 理解语言 → 拆解任务 │
│ │
│ 记忆 工具箱 │
│ 记住信息 ↔ 调用API/服务 │
│ │
│ 执行器 │
│ 实际执行操作 │
│ │
└─────────────────────────────────────────┘
LLM(大脑)——理解和思考
LLM就是像GPT-4、Claude这样的大语言模型。它负责理解你说的话,分析问题的本质,生成合理的回答。LLM就像一个人的大脑,负责思考和语言理解。
记忆——记住上下文
AI Agent需要记住之前对话的内容、任务的中间状态、已经尝试过的方法、用户偏好和习惯。记忆就像一个人的笔记本,随时记录和查阅重要信息。
实际例子:
用户:帮我看看昨天那个项目的bug修好了吗?
AI Agent(有记忆):
知道"昨天"指的是哪一天
知道"那个项目"是哪个项目
记得之前讨论过什么bug
没有记忆的AI只能问:"你说的是哪个项目?"
工具箱——实际行动的能力
这是AI Agent和传统聊天机器人最大的区别。AI Agent可以调用各种工具:读取和写入文件、调用网络API、查询数据库、执行系统命令、发送邮件和消息。工具就像一个人的手脚,让它能够实际操作世界。
规划器——拆解和规划
面对复杂任务,AI Agent需要把大任务拆成小步骤,决定先做什么、后做什么,根据执行结果调整计划,处理意外情况。规划器就像一个人的执行力,知道如何一步步完成目标。
1.3 看个实际例子
假设你对AI Agent说:“帮我分析这个月的销售数据,找出表现最好的产品,然后生成一份报告发送给老板”
传统聊天机器人只能提供指导,告诉你如何用Excel分析数据,但无法实际执行。
AI Agent会经历完整的执行过程:
- 理解任务(LLM):需要数据分析+邮件发送
- 查询记忆:销售数据在哪?老板邮箱是什么?
- 规划步骤:读取文件→分析数据→生成报告→发送邮件
- 逐步执行:调用相应的工具完成任务
- 完成并反馈结果

1.4 为什么需要AI Agent?
传统AI只能对话,不能行动。每次都要重新输入背景信息,无法完成多步骤任务,需要人工在AI和工具之间"传话"。
AI Agent能够真正完成工作,而不只是提供建议。它记住上下文,对话更自然,可以自主完成复杂任务,相当于24/7待命的数字员工。
现实应用场景:
- 开发助手:帮你写代码、运行测试、部署应用
- 数据分析:自动从数据库提取数据、生成图表、写报告
- 客服机器人:不仅能回答问题,还能直接查询订单、办理退款
- 个人助理:管理日程、回复邮件、整理文件
二、MCP:让AI和工具说同一种语言
2.1 MCP解决什么问题?
在MCP出现之前,让AI使用工具有一个大问题:每个工具都有自己的"方言"。
想象一下,你要和不同国家的人合作。法国人说法语,日本人说日语,德国人说德语。如果你想让他们合作,你需要学会三种语言,每次说话都要切换语言,非常麻烦且容易出错。
AI世界也有同样的问题。Claude用自己的格式,ChatGPT用自己的格式,Gemini用自己的格式,每个工具也都有自己的API格式。结果就是开发者要为每个AI重复开发,工具无法在不同AI间复用,每次集成都要重新学习。
MCP(Model Context Protocol)就是"AI世界的英语"——统一的通信标准,所有AI都学会这个标准,所有工具都支持这个标准,一次开发,到处使用。
2.2 MCP是什么?(用USB做比喻)
MCP = AI世界的USB标准
还记得以前每个手机都有自己专用的充电器吗?诺基亚用诺基亚的充电器,三星用三星的充电器,摩托罗拉用摩托罗拉的充电器,出门要带一堆充电器,非常麻烦。
后来有了USB标准。所有设备都用同样的接口,一根线可以给所有设备充电,简单、统一、方便。
MCP就是让AI和工具"即插即用"的标准。
没有MCP的世界:
┌──────────┐ ┌──────────┐
│ Claude │---特殊格式1→│ 文件工具 │
└──────────┘ └──────────┘
┌──────────┐ ┌──────────┐
│ ChatGPT │---特殊格式2→│ 文件工具 │
└──────────┘ └──────────┘
有MCP的世界:
┌──────────┐ ┌──────────┐ ┌──────────┐
│ Claude │ │ ChatGPT │ │ Gemini │
└─────┬────┘ └─────┬────┘ └─────┬────┘
│ │ │
└─────────────────────┼─────────────────────┘
│
┌───────▼────────┐
│ MCP │
│ 通用接口 │
└───────┬────────┘
│
┌─────────────────────┼─────────────────────┐
↓ ↓ ↓
┌──────────┐ ┌──────────┐ ┌──────────┐
│ 文件系统 │ │ 数据库 │ │ Web API │
│ 服务器 │ │ 服务器 │ │ 服务器 │
└──────────┘ └──────────┘ └──────────┘
2.3 MCP的工作原理
MCP的通信过程就像在餐厅点菜。你坐下后,服务员给你菜单,你点菜提出需求,服务员把订单送到厨房(工具服务器),厨师做菜执行操作,最后服务员把菜端给你返回结果。
在MCP的世界里:
- 你启动Claude
- Claude读取.mcp.json配置(就像看菜单)
- 你说:“帮我读取文件X”
- Claude连接MCP服务器
- 握手阶段:Claude问"你是谁?你能做什么?“,服务器回答"我是文件系统服务器,我可以读写文件”
- Claude调用工具:“请读取文件X”
- 服务器执行操作,返回结果
- Claude处理结果,回复你

2.4 MCP的核心特性
标准化的对话格式
MCP使用JSON-RPC格式,就像所有人都用同一种语言交流。无论哪个AI,想读取文件都要用统一的格式。
资源与工具分离
MCP区分两种东西:
资源 = 数据。类比餐厅的食材,例子包括文件、数据库记录、API返回的数据。
工具 = 操作。类比厨师的烹饪技巧,例子包括读取文件、查询数据库、发送HTTP请求。
双向实时通信
MCP支持多种通信方式:stdio适合本地工具,SSE适合实时更新,WebSocket适合复杂交互。
2.5 MCP的实际应用例子
例子1:文件系统服务器
# .mcp.json 配置
{
"mcpServers": {
"filesystem": {
"command": "npx",
"args": ["-y", "@modelcontextprotocol/server-filesystem", "C:/Users/admin/Documents"]
}
}
}
现在Claude可以读取你Documents文件夹的文件,创建新文件,搜索文件内容,列出目录结构。
例子2:数据库服务器
{
"mcpServers": {
"postgres": {
"command": "node",
"args": ["mcp-postgres-server/index.js"]
}
}
}
现在Claude可以执行SQL查询,读取数据库表结构,插入和更新数据。
2.6 为什么MCP很重要?
对开发者来说,写一次工具,所有AI都能用。不需要为每个AI单独适配,专注业务逻辑,不用操心通信细节。
对用户来说,不同AI都能访问相同的工具,更容易扩展AI的能力,工具生态更丰富。
对整个行业来说,推动标准化,降低开发门槛,加速AI应用创新。
三、Claude Skills:让AI的能力像"装备"一样
3.1 Skills解决什么问题?
想象你在玩游戏。没有技能系统的游戏,角色一开始就固定了所有能力,想换玩法只能重新创建角色,不同角色的能力无法共享,每次都要从头练起。
有技能系统的游戏,可以学习和装备不同的技能,随时更换技能搭配,技能可以在角色间共享,想换玩法换套技能就行。
Claude Skills就是AI的"技能系统"。
3.2 什么是Skills?
Skills = AI的"App Store"
想想你的智能手机。只有一个基本操作系统,但可以安装各种App——相机、微信、地图、游戏。想要什么功能,就装什么App,不用的可以卸载,App可以分享给朋友。
Claude Skills就是Claude的"App"。
Claude本体 = 只会聊天的AI
Claude + Skills = 会干活的超级AI
例如:
- Claude + 代码审查Skill = 代码审查专家
- Claude + 数据分析Skill = 数据分析师
- Claude + 文档写作Skill = 技术写作专家
- Claude + 翻译Skill = 专业翻译
3.3 Skills vs 其他机制
Claude之前有几种扩展AI能力的方式,但都有局限。
| 机制 | 比喻 | 优点 | 缺点 |
|---|---|---|---|
| Rules | 系统设置 | 简单直接 | 只能用于单个项目,只能写静态规则 |
| Commands | 快捷键 | 一键执行固定操作 | 操作写死,不能灵活变化,每个项目都要重新配置 |
| MCP Servers | 外设 | 可以连接外部工具 | 需要写完整的代码,偏技术,普通用户难以上手 |
| Skills | App | 动态加载上下文,可以分享,即装即用,可以组合使用 | 学习曲线 |
3.4 Skills的核心特性
动态上下文加载
Skills可以根据需要加载不同的"知识库"和"规则"。就像换装备,每套装备适合不同的场景。
人设与能力分离
Skills把"角色"和"技能"分开管理。就像演戏,同一个演员(Claude)可以扮演不同的角色(医生、律师、老师),每个角色有自己的专业知识和说话方式。
Hooks生命周期钩子
Skills可以在特定时机自动触发某些行为。就像游戏的自动触发技能,满足条件就自动发动。
// 代码审查Skill的Hooks
hooks: {
// 你要写代码时,自动检查规范
beforeWrite: "检查代码是否符合团队规范",
// 你修改完代码后,自动建议测试
afterEdit: "建议添加哪些测试用例",
// 出错时,自动提供修复建议
onError: "分析错误原因并提供解决方案"
}

3.5 Skills的实际应用例子
例子1:代码生成Skill
场景:你想让Claude帮你写代码,但要符合你们团队的风格。
传统方式:每次对话都要说"请用Python写一个函数,要符合我们团队的风格:用Type Hints,添加docstring,错误要抛出自定义异常,命名用snake_case…"
用Skills:创建一个python-developer Skill,配置团队的编码规范、项目最佳实践、常用代码模板。Claude会自动按照规范写代码,不用每次重复说明。
例子2:文档写作Skill
创建tech-writer Skill,加载文档模板、写作规范、常用术语表。Claude会按照规范生成技术文档。
例子3:数据分析师Skill
创建data-analyst Skill,通过MCP连接数据库和pandas,加载分析方法论、常用图表类型、业务指标定义。Claude会按照工作流程完成数据分析任务。
3.6 Skills如何让AI更强大?
专业化:每个Skill专注于一个领域,深度优化,效果更好,可以不断迭代更新。
可组合:同时激活多个Skill,Skills之间可以协作,像搭积木一样组合能力。
可分享:开发者可以发布自己的Skill,用户可以安装使用,形成Skill生态系统。
可进化:Skill可以独立更新,用户反馈可以快速融入,持续改进。
四、三者如何协作:完整的实战案例
4.1 演进时间线
这三大技术是如何逐步发展的?
2023年 2024年上半年 2024年底 2025年
│ │ │ │
↓ ↓ ↓ ↓
LLM爆发 → Agent探索 → MCP诞生 → Skills推出
(能说话) (能干活) (统一语言) (可装备)
像这样:
宝宝会说话 → 会做家务 → 发明通用语言 → 发明技能书
4.2 技术栈对比:新旧两种方式
2024年做法(没有MCP和Skills):每次都要手动定义工具,每个AI要用不同的API调用方式,每个用户的偏好都要在对话中说明。
2025年做法(有MCP和Skills):
第一步:配置MCP服务器(一次配置,所有AI都能用)
第二步:安装别人写好的Skill,直接使用
第三步:直接开始工作

4.3 完整协作案例:自动化代码审查流程
需求:创建一个AI助手,能够自动审查代码并提交修复建议。
第1步:配置MCP(连接工具)
# .mcp.json
{
"mcpServers": {
"filesystem": {
"command": "npx",
"args": ["-y", "@modelcontextprotocol/server-filesystem", "./src"]
},
"github": {
"command": "npx",
"args": ["-y", "@modelcontextprotocol/server-github"],
"env": {
"GITHUB_TOKEN": "你的GitHub令牌"
}
}
}
}
MCP的作用:filesystem服务器让Claude能读取代码文件,github服务器让Claude能创建PR和Issue。
第2步:创建Skill(定义能力)
# skill: code-reviewer
name: 代码审查专家
description: 自动审查代码质量并提供修复建议
persona:
角色: 资深代码审查专家
语气: 建设性、友好、专业
原则: 先说好的,再提改进建议
context_files:
- coding-standards.md
- common-issues.md
- best-practices.md
hooks:
afterReadFile:
- 检查文件编码规范
- 检查潜在安全问题
- 检查性能问题
required_mcp_tools:
- filesystem.read
- filesystem.write
- github.pr
Skills的作用:定义了"如何审查"的知识和规则,规定了审查的流程和标准,在适当时机自动触发检查。
第3步:AI Agent执行(实际干活)
现在你只需要说:“帮我审查 src/user.py 这个文件”
AI Agent的执行过程:
- 理解需求:用户想审查 src/user.py
- 检查可用的能力(Skill加载):code-reviewer Skill已激活,知道要用Python编码规范审查
- 制定计划:读取文件内容→按标准检查代码→生成审查报告→创建PR提交建议
- 执行步骤1(MCP调用):调用 filesystem.read 读取 src/user.py
- 分析代码(LLM + Skill知识):加载编码规范,应用检查清单,逐行审查代码
- 生成报告:发现3个问题——缺少类型注解、SQL查询有注入风险、变量名不规范
- 执行步骤4(MCP调用):调用 github.pr 创建PR
- 完成:报告审查结果,提供PR链接

4.4 三者分工总结
| 组件 | 角色 | 比喻 | 在例子中的作用 |
|---|---|---|---|
| AI Agent | 执行主体 | 员工 | 理解需求、规划步骤、执行任务、协调资源 |
| MCP | 通信协议 | 标准接口 | 让Claude能连接文件系统和GitHub |
| Skills | 能力模块 | 技能包 | 提供代码审查的知识和规则 |
用一个生活中的场景做总结:想象你要装修房子。
- AI Agent = 装修工(实际干活的人)
- MCP = 标准工具接口(所有工具都能插的电钻插座)
- Skills = 专业技能包(电工技能包、木工技能包、油漆技能包)
五、更多实战应用场景
5.1 场景一:个人知识管理助手
需求:让AI帮你管理笔记、整理知识、生成摘要
配置MCP:连接Notion数据库,访问本地笔记文件
创建Skill:knowledge-manager,加载笔记分类方法、知识提取技巧、摘要模板
使用:你说"帮我整理今天的会议记录",AI会自动读取会议记录文件,提取决策和行动项,按模板生成摘要,保存到Notion,关联到相关项目。
5.2 场景二:自动化测试助手
需求:让AI自动编写和运行测试
配置MCP:读写代码、版本控制、运行测试
创建Skill:test-engineer,加载测试用例设计方法、测试覆盖率标准、常见测试框架用法。配置Hooks:写代码后自动生成单元测试、生成集成测试、检查测试覆盖率。
5.3 场景三:客户服务机器人
需求:让AI自动处理客户咨询
配置MCP:查询订单、发送邮件、处理退款
创建Skill:customer-service,加载服务话术模板、常见问题FAQ、退款政策、客户信息保护规范。设置persona:语气友好、专业、耐心,原则是先倾听后解决,边界是不承诺无法兑现的事。
六、如何开始使用这些技术?
6.1 学习路线图
阶段一:理解基础(1-2周)
了解LLM的基本概念,学习如何与AI对话,理解什么是API。
阶段二:实践MCP(2-4周)
学习MCP协议基础,搭建第一个MCP服务器,连接Claude Code,尝试调用工具。
阶段三:创建Skills(2-4周)
学习Skill的配置方式,创建你的第一个Skill,测试和优化,分享给团队使用。
阶段四:构建Agent(4-8周)
设计完整的Agent工作流,组合多个Skills,实现复杂自动化,部署到生产环境。
6.2 推荐学习资源
官方文档:
- MCP官方网站 - MCP协议详解
- Claude Code MCP文档 - 实战教程
教程:
- MCP完整指南 - 从零构建MCP服务器
- Claude Skills构建指南 - 官方PDF指南
中文资源:
6.3 实践建议
从简单开始:先用现有的MCP服务器(不用自己写),先创建简单的Skill(不用一次做完美),先在个人项目中使用(不用急于推广)。
持续迭代:收集使用反馈,逐步完善功能,分享经验给社区。
加入社区:关注官方博客和GitHub,参与Discord讨论,分享你的Skills。
七、总结与展望
7.1 核心要点回顾
AI Agent:LLM大脑 + 记忆 + 工具 + 规划。让AI能"干活"而不只是"说话",像一个真正的数字员工。
MCP:AI世界的USB标准。统一AI和工具的通信方式,一次开发,所有AI都能用。
Skills:AI的能力模块/技能包。可以动态加载、组合、分享,让AI专业化、场景化。
7.2 三者关系的一句话总结
AI Agent是"员工",MCP是"标准接口",Skills是"专业技能包"。
没有MCP和Skills,AI Agent每次都要从零开始,重复开发。有了MCP和Skills,AI Agent可以快速装备专业能力,立即干活。
7.3 2025年的趋势
- 标准化加速:MCP正在成为行业共识
- 生态爆发:Skills市场快速成长
- 应用普及:更多企业和个人开始使用Agent
- 能力增强:Agent从"执行"走向"决策"
7.4 未来展望
现在:手动编写工具,重复配置MCP,单打独斗,只能做简单任务。
未来:Skills市场(像App Store),一键安装能力包,Agent协作网络,处理复杂业务流程。
AI Agent的终极愿景:
每个人都能轻松构建自己的AI助手,
每个组织都能打造专属的Agent生态系统,
AI成为像电力一样的基础设施,
随时可用,即插即用。
参考资源
MCP相关
Claude Skills相关
AI Agent相关
更多推荐

所有评论(0)