MCP、CLI、Skill:AI Agent开发中的三大流派,你选对了吗?2026年最新格局深度解析!
AI Agent开发中的工具选择:MCP、CLI与Skill的对比与应用 摘要: 文章分析了MCP、CLI和Skill三种AI开发工具的特点与应用场景。MCP作为标准化协议面临上下文成本高、配置复杂等问题;CLI凭借透明可调试的特性更符合LLM使用习惯;Skill则专注于封装领域知识。当前趋势显示,AI Agent架构正从"描述一切"转向"执行一切",Ski
文章探讨了MCP、CLI和Skill在AI Agent开发中的应用与区别。MCP作为连接AI与外部工具的协议,面临上下文成本、配置复杂等问题;CLI通过封装API提供透明可调试的命令行工具,更符合LLM的自然习惯;Skill则专注于领域知识封装,指导AI如何执行任务。文章指出,AI Agent架构正从描述一切转向执行一切,Skill和CLI的重要性日益凸显,而MCP则退化为特定场景下的标准化选项。开发者应根据实际需求选择合适的方案,或将三者结合使用。
2024年底,MCP发布的时候,整个AI圈都在欢呼:“AI的USB-C来了!”
2026年3月,Perplexity CTO公开宣布:放弃MCP,全面转向API+CLI。
同一个月,OpenClaw(原Clawdbot)项目在GitHub登上全球第一,它的 Skills 系统成了行业讨论的焦点。
这不是零星个案。这是行业在用脚投票。
但"投票"投的到底是什么?MCP、CLI、Skill,这三个东西到底在争什么、适合什么场景、各自的优缺点是什么——大多数文章讲不清楚。
这篇文章,把这件事一次讲清楚。
一、先把三个东西说清楚
MCP:让AI"发现"工具的协议
MCP(Model Context Protocol)是Anthropic在2024年11月发布的开放协议。它解决的核心问题是:AI怎么知道有哪些工具可以用,以及怎么调用它们。
MCP定义了三种"原语":
- Tools(工具):AI可以主动调用的函数。每个工具有完整的JSON Schema描述——名称、参数、返回值——AI看到Schema就知道怎么调用。
- Resources(资源):AI可以读取的数据。比如你的项目文档、数据库结构。AI需要上下文时,自己加载。
- Prompts(提示):预定义的模板。用户触发关键词,AI按模板执行。
所以MCP的核心价值是:标准化了"工具是什么"和"怎么发现工具"。
一个MCP Server一旦启动,连接的AI应用自动知道它能提供哪些工具,不需要每个AI应用单独写适配代码。
CLI:封装API的"命令行工具"
这里的CLI,不是指Claude Code、Gemini CLI这些AI开发工具,而是指那些封装了API功能的命令行工具。
比如:
gh— GitHub CLI,封装了GitHub REST APIkubectl— Kubernetes CLI,封装了K8s APIjira— JIRA CLI,封装了JIRA APIaws— AWS CLI,封装了AWS所有服务API
这些CLI工具早就存在,程序员用了几十年。2026年的新变化是:AI Agent开始直接调用这些CLI来完成真实任务。
Agent执行gh issue list,直接拿到GitHub数据。Agent执行kubectl get pods,直接拿到集群状态。不需要MCP Server,不需要JSON-RPC,只要Agent会执行Shell命令就行。
Skill:告诉AI"怎么做"的技能包
Skill是更上层的抽象。
如果说MCP告诉AI"有哪些工具可以用",Skill告诉AI"遇到这类任务,应该用什么方法、按什么步骤来做"。
一个数据库查询的Skill,不仅告诉AI"可以连接MySQL",还告诉它:
- 这个业务的数据在哪几张表里
- 常用的join方式是什么
- 哪些查询要避免(防止全表扫描)
- 查出来的数据怎么解读
Skill把领域知识封装进来,而不只是工具接口。
二、MCP的四个实际问题
MCP的设计想法是合理的,但在实际使用中遇到了几个真实问题。
问题1:上下文成本线性增长
MCP的工作方式是:把每个工具的定义——名称、描述、参数Schema——全部注入AI的上下文窗口。
接10个服务,每个服务5个工具,就是50个工具定义。每次对话开始,光是"菜单"就要消耗几千个token。
有开发者实测:仅加载一个Playwright MCP Server,就占用了200K上下文窗口的8%。多接几个,AI能用来"正事"的空间就所剩无几了。
这是MCP设计上的根本矛盾:它想连接一切,但上下文窗口是有限的。
问题2:大部分MCP Server只是API套壳
仔细看GitHub上那些MCP Server,相当一部分的本质是:
MCP Server = REST API + 一层JSON-RPC包装
你本来可以直接curl https://api.github.com/issues,现在多了一层:AI → JSON-RPC → MCP Server → GitHub API。
多一层抽象,多一层出错机会,多一层维护成本。但核心能力没有任何增加。
当一个"标准"的主要产出是把已有能力重新包装,这个标准的价值就值得怀疑了。
问题3:配置和维护成本高
MCP Server经常启动失败。配置文件错一个字符、环境变量漏一个、端口被占用——就要折腾半天。
认证也是问题。每个MCP工具要单独认证,Token会过期,需要定期重新授权。
问题4:“builder多,用户少”
从MCP发布以来,社区里一直有个尖锐的观察:写MCP Server的人,比真正在日常工作中用MCP的人多。
你去GitHub搜"MCP Server",能找到几千个。但问身边的开发者——有几个人的日常工作流里真正在用MCP?大多数人的体验是:装了,试了,卡了,卸了。
三、CLI模式凭什么被选择
透明可调试
让AI执行Shell命令,每一步你都看得见:
$ gh issue list --state open --limit 10
输入输出清晰,出了问题立刻能排查。
换成MCP,工具调用隐藏在JSON-RPC内部:
{"method": "tools/call", "params": {"name": "github_list_issues", ...}}
出了问题?你得翻MCP Server日志,查JSON-RPC请求响应,确认传输层没出错——调试链条拉长三倍。
可组合
Unix管道的哲学是:每个命令做一件事,用管道串联起来:
# 找生产环境最近一小时的错误,按频率排序kubectl logs -n prod deployment/api --since=1h | grep ERROR | sort | uniq -c | sort -rn | head -20
五个简单命令,完成了一个复杂的日志分析任务。每个中间结果都可以单独查看和验证。
MCP模式下,你需要专门构建一个"日志分析"MCP Server,然后让AI在多个Server之间来回传递数据——每次传递都要经过序列化/反序列化,都要占用上下文窗口。
LLM天然熟悉这些命令
这是最被低估的优势。
当今所有主流LLM,都在海量的man手册、Shell脚本、Stack Overflow回答中训练过。kubectl、gh、git、docker——这些命令的用法,模型已经知道。
你让Claude执行gh pr review,它知道怎么解读输出,知道--approved是什么意思。
你让它调用一个叫github_submit_review的MCP工具——这个名字在它的训练数据里可能根本不存在,它只能靠Schema描述去猜这个工具是干什么的。
上下文成本低
gh issue list 返回10行文本。 MCP工具返回的是完整结构化数据 + 所有字段的描述。
后者信息更丰富,但代价是消耗更多token。在上下文窗口稀缺的情况下,这是个真实trade-off。
四、Skill补上了哪一块
MCP解决"能不能连接",CLI解决"能不能执行",Skill解决"知不知道怎么做"。
举个例子。
MCP让AI能连接数据库。CLI让AI能执行SQL查询。但AI未必知道:
- 这个业务线的数据在哪张表、哪个schema
- 常用的关联查询怎么写效率最高
- 哪些字段要特别留意(比如deleted标记、时间戳字段的时区)
- 查询结果异常时怎么排查
这些是领域知识,不是工具接口。
Skill可以包含这些知识:什么场景该用什么工具、最佳实践是什么、常见错误怎么排查、业务相关的特殊规则。
所以最完整的方案可能是:Skill管策略,CLI管执行,MCP作为可选的标准化连接层。
MCP不是非此即彼的替代品,而是可以和其他方案共存的协议——特别是在需要"一个工具多处复用"的场景下,MCP的标准化价值就体现出来了。
五、三个东西怎么选
不是非此即彼。它们解决不同层次的问题。
选MCP的场景:
- 你需要让同一个工具被多个AI应用复用(MCP的可复用性)
- 你在做面向非技术用户的AI产品,需要标准协议降低集成成本
- 你的用户不需要知道底层工具是什么,只需要AI能访问特定数据
选CLI模式的场景:
- 你的工具链已经存在成熟的CLI工具(gh、kubectl等)
- 透明性和可调试性是关键需求
- 你的Agent需要操作系统级别的执行能力
- 上下文窗口成本是真实瓶颈
选Skill的场景:
- 你需要给AI注入领域知识,不只是工具接口
- 任务复杂,需要分步骤、有策略地执行
- 你希望AI的行为高度可控,有明确的最佳实践路径
实际上:这三个可以一起用。
Skill负责"遇到这个任务用什么方法",CLI负责"方法确定后具体怎么跑",MCP负责"如果有需要复用的工具,怎么让多个AI应用连接它"。
六、2026年的格局
从这轮讨论里,能看到一个清晰的趋势:
AI Agent的架构,正在从"描述一切"转向"执行一切"。
旧范式:Agent是调度员——加载所有工具定义,根据描述选择工具,代理执行。 新范式:Agent是操作员——直接在操作系统上执行命令,拥有和人类开发者相同的能力边界。
Skill在这个转变里扮演了关键角色——它不是在描述工具,而是在传递经验。告诉AI的不只是"能做什么",更是"应该怎么做、为什么要这样做"。
MCP不会消失,但它的定位在发生变化:从"AI连接外部世界的主流方式",退守到"特定场景下的标准化选项"。就像SOAP/WSDL没有消失,只是从互联网主流退到了企业内部的特定场景。
2026年AI行业最大的机会,毫无疑问就在应用层!
字节跳动已有7个团队全速布局Agent
大模型岗位暴增69%,年薪破百万!
腾讯、京东、百度开放招聘技术岗,80%与AI相关……
如今,超过60%的企业都在推进AI产品落地,而真正能交付项目的 大模型应用开发工程师 **,**却极度稀缺!
落地AI应用绝对不是写几个prompt,调几个API就能搞定的,企业真正需要的,是能搞定这三项核心能力的人:
✅RAG:融入外部信息,修正模型输出,给模型装靠谱大脑
✅Agent智能体:让AI自主干活,通过工具调用(Tools)环境交互,多步推理完成复杂任务。比如做智能客服等等……
✅微调:针对特定任务优化,让模型适配业务
目前,脉脉上有超过1000家企业发布大模型相关岗位,人工智能岗平均月薪7.8w!实习生日薪高达4000!远超其他行业收入水平!
技术的稀缺性,才是你「值钱」的关键!
具备AI能力的程序员,比传统开发高出不止一截!有的人早就转行AI方向,拿到百万年薪!👇🏻👇🏻

AI浪潮,正在重构程序员的核心竞争力!现在入场,仍是最佳时机!
我把大模型的学习全流程已经整理📚好了!抓住AI时代风口,轻松解锁职业新可能,希望大家都能把握机遇,实现薪资/职业跃迁~
这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

⭐️从大模型微调到AI Agent智能体搭建
剖析AI技术的应用场景,用实战经验落地AI技术。从GPT到最火的开源模型,让你从容面对AI技术革新!
大模型微调
-
掌握主流大模型(如DeepSeek、Qwen等)的微调技术,针对特定场景优化模型性能。
-
学习如何利用领域数据(如制造、医药、金融等)进行模型定制,提升任务准确性和效率。
RAG应用开发
- 深入理解检索增强生成(Retrieval-Augmented Generation, RAG)技术,构建高效的知识检索与生成系统。
- 应用于垂类场景(如法律文档分析、医疗诊断辅助、金融报告生成等),实现精准信息提取与内容生成。
AI Agent智能体搭建
- 学习如何设计和开发AI Agent,实现多任务协同、自主决策和复杂问题解决。
- 构建垂类场景下的智能助手(如制造业中的设备故障诊断Agent、金融领域的投资分析Agent等)。

如果你也有以下诉求:
快速链接产品/业务团队,参与前沿项目
构建技术壁垒,从竞争者中脱颖而出
避开35岁裁员危险期,顺利拿下高薪岗
迭代技术水平,延长未来20年的新职业发展!
……
那这节课你一定要来听!
因为,留给普通程序员的时间真的不多了!
立即扫码,即可免费预约
「AI技术原理 + 实战应用 + 职业发展」
「大模型应用开发实战公开课」
👇👇

👍🏻还有靠谱的内推机会+直聘权益!!
完课后赠送:大模型应用案例集、AI商业落地白皮书
更多推荐




所有评论(0)