文章探讨了MCP、CLI和Skill在AI Agent开发中的应用与区别。MCP作为连接AI与外部工具的协议,面临上下文成本、配置复杂等问题;CLI通过封装API提供透明可调试的命令行工具,更符合LLM的自然习惯;Skill则专注于领域知识封装,指导AI如何执行任务。文章指出,AI Agent架构正从描述一切转向执行一切,Skill和CLI的重要性日益凸显,而MCP则退化为特定场景下的标准化选项。开发者应根据实际需求选择合适的方案,或将三者结合使用。


2024年底,MCP发布的时候,整个AI圈都在欢呼:“AI的USB-C来了!”

2026年3月,Perplexity CTO公开宣布:放弃MCP,全面转向API+CLI。

同一个月,OpenClaw(原Clawdbot)项目在GitHub登上全球第一,它的 Skills 系统成了行业讨论的焦点。

这不是零星个案。这是行业在用脚投票。

但"投票"投的到底是什么?MCP、CLI、Skill,这三个东西到底在争什么、适合什么场景、各自的优缺点是什么——大多数文章讲不清楚。

这篇文章,把这件事一次讲清楚。


一、先把三个东西说清楚

MCP:让AI"发现"工具的协议

MCP(Model Context Protocol)是Anthropic在2024年11月发布的开放协议。它解决的核心问题是:AI怎么知道有哪些工具可以用,以及怎么调用它们。

MCP定义了三种"原语":

  • Tools(工具):AI可以主动调用的函数。每个工具有完整的JSON Schema描述——名称、参数、返回值——AI看到Schema就知道怎么调用。
  • Resources(资源):AI可以读取的数据。比如你的项目文档、数据库结构。AI需要上下文时,自己加载。
  • Prompts(提示):预定义的模板。用户触发关键词,AI按模板执行。

所以MCP的核心价值是:标准化了"工具是什么"和"怎么发现工具"

一个MCP Server一旦启动,连接的AI应用自动知道它能提供哪些工具,不需要每个AI应用单独写适配代码。


CLI:封装API的"命令行工具"

这里的CLI,不是指Claude Code、Gemini CLI这些AI开发工具,而是指那些封装了API功能的命令行工具

比如:

  • gh — GitHub CLI,封装了GitHub REST API
  • kubectl — Kubernetes CLI,封装了K8s API
  • jira — JIRA CLI,封装了JIRA API
  • aws — AWS CLI,封装了AWS所有服务API

这些CLI工具早就存在,程序员用了几十年。2026年的新变化是:AI Agent开始直接调用这些CLI来完成真实任务

Agent执行gh issue list,直接拿到GitHub数据。Agent执行kubectl get pods,直接拿到集群状态。不需要MCP Server,不需要JSON-RPC,只要Agent会执行Shell命令就行。


Skill:告诉AI"怎么做"的技能包

Skill是更上层的抽象。

如果说MCP告诉AI"有哪些工具可以用",Skill告诉AI"遇到这类任务,应该用什么方法、按什么步骤来做"。

一个数据库查询的Skill,不仅告诉AI"可以连接MySQL",还告诉它:

  • 这个业务的数据在哪几张表里
  • 常用的join方式是什么
  • 哪些查询要避免(防止全表扫描)
  • 查出来的数据怎么解读

Skill把领域知识封装进来,而不只是工具接口。


二、MCP的四个实际问题

MCP的设计想法是合理的,但在实际使用中遇到了几个真实问题。

问题1:上下文成本线性增长

MCP的工作方式是:把每个工具的定义——名称、描述、参数Schema——全部注入AI的上下文窗口。

接10个服务,每个服务5个工具,就是50个工具定义。每次对话开始,光是"菜单"就要消耗几千个token。

有开发者实测:仅加载一个Playwright MCP Server,就占用了200K上下文窗口的8%。多接几个,AI能用来"正事"的空间就所剩无几了。

这是MCP设计上的根本矛盾:它想连接一切,但上下文窗口是有限的。

问题2:大部分MCP Server只是API套壳

仔细看GitHub上那些MCP Server,相当一部分的本质是:

MCP Server = REST API + 一层JSON-RPC包装

你本来可以直接curl https://api.github.com/issues,现在多了一层:AI → JSON-RPC → MCP Server → GitHub API。

多一层抽象,多一层出错机会,多一层维护成本。但核心能力没有任何增加。

当一个"标准"的主要产出是把已有能力重新包装,这个标准的价值就值得怀疑了。

问题3:配置和维护成本高

MCP Server经常启动失败。配置文件错一个字符、环境变量漏一个、端口被占用——就要折腾半天。

认证也是问题。每个MCP工具要单独认证,Token会过期,需要定期重新授权。

问题4:“builder多,用户少”

从MCP发布以来,社区里一直有个尖锐的观察:写MCP Server的人,比真正在日常工作中用MCP的人多。

你去GitHub搜"MCP Server",能找到几千个。但问身边的开发者——有几个人的日常工作流里真正在用MCP?大多数人的体验是:装了,试了,卡了,卸了。


三、CLI模式凭什么被选择

透明可调试

让AI执行Shell命令,每一步你都看得见:

$ gh issue list --state open --limit 10

输入输出清晰,出了问题立刻能排查。

换成MCP,工具调用隐藏在JSON-RPC内部:

{"method": "tools/call", "params": {"name": "github_list_issues", ...}}

出了问题?你得翻MCP Server日志,查JSON-RPC请求响应,确认传输层没出错——调试链条拉长三倍。

可组合

Unix管道的哲学是:每个命令做一件事,用管道串联起来:

# 找生产环境最近一小时的错误,按频率排序kubectl logs -n prod deployment/api --since=1h | grep ERROR | sort | uniq -c | sort -rn | head -20

五个简单命令,完成了一个复杂的日志分析任务。每个中间结果都可以单独查看和验证。

MCP模式下,你需要专门构建一个"日志分析"MCP Server,然后让AI在多个Server之间来回传递数据——每次传递都要经过序列化/反序列化,都要占用上下文窗口。

LLM天然熟悉这些命令

这是最被低估的优势。

当今所有主流LLM,都在海量的man手册、Shell脚本、Stack Overflow回答中训练过。kubectlghgitdocker——这些命令的用法,模型已经知道。

你让Claude执行gh pr review,它知道怎么解读输出,知道--approved是什么意思。

你让它调用一个叫github_submit_review的MCP工具——这个名字在它的训练数据里可能根本不存在,它只能靠Schema描述去猜这个工具是干什么的。

上下文成本低

gh issue list 返回10行文本。 MCP工具返回的是完整结构化数据 + 所有字段的描述。

后者信息更丰富,但代价是消耗更多token。在上下文窗口稀缺的情况下,这是个真实trade-off。


四、Skill补上了哪一块

MCP解决"能不能连接",CLI解决"能不能执行",Skill解决"知不知道怎么做"。

举个例子。

MCP让AI能连接数据库。CLI让AI能执行SQL查询。但AI未必知道:

  • 这个业务线的数据在哪张表、哪个schema
  • 常用的关联查询怎么写效率最高
  • 哪些字段要特别留意(比如deleted标记、时间戳字段的时区)
  • 查询结果异常时怎么排查

这些是领域知识,不是工具接口。

Skill可以包含这些知识:什么场景该用什么工具、最佳实践是什么、常见错误怎么排查、业务相关的特殊规则。

所以最完整的方案可能是:Skill管策略,CLI管执行,MCP作为可选的标准化连接层

MCP不是非此即彼的替代品,而是可以和其他方案共存的协议——特别是在需要"一个工具多处复用"的场景下,MCP的标准化价值就体现出来了。


五、三个东西怎么选

不是非此即彼。它们解决不同层次的问题。

选MCP的场景

  • 你需要让同一个工具被多个AI应用复用(MCP的可复用性)
  • 你在做面向非技术用户的AI产品,需要标准协议降低集成成本
  • 你的用户不需要知道底层工具是什么,只需要AI能访问特定数据

选CLI模式的场景

  • 你的工具链已经存在成熟的CLI工具(gh、kubectl等)
  • 透明性和可调试性是关键需求
  • 你的Agent需要操作系统级别的执行能力
  • 上下文窗口成本是真实瓶颈

选Skill的场景

  • 你需要给AI注入领域知识,不只是工具接口
  • 任务复杂,需要分步骤、有策略地执行
  • 你希望AI的行为高度可控,有明确的最佳实践路径

实际上:这三个可以一起用。

Skill负责"遇到这个任务用什么方法",CLI负责"方法确定后具体怎么跑",MCP负责"如果有需要复用的工具,怎么让多个AI应用连接它"。


六、2026年的格局

从这轮讨论里,能看到一个清晰的趋势:

AI Agent的架构,正在从"描述一切"转向"执行一切"。

旧范式:Agent是调度员——加载所有工具定义,根据描述选择工具,代理执行。 新范式:Agent是操作员——直接在操作系统上执行命令,拥有和人类开发者相同的能力边界。

Skill在这个转变里扮演了关键角色——它不是在描述工具,而是在传递经验。告诉AI的不只是"能做什么",更是"应该怎么做、为什么要这样做"。

MCP不会消失,但它的定位在发生变化:从"AI连接外部世界的主流方式",退守到"特定场景下的标准化选项"。就像SOAP/WSDL没有消失,只是从互联网主流退到了企业内部的特定场景。

2026年AI行业最大的机会,毫无疑问就在应用层

字节跳动已有7个团队全速布局Agent

大模型岗位暴增69%,年薪破百万!

腾讯、京东、百度开放招聘技术岗,80%与AI相关……

如今,超过60%的企业都在推进AI产品落地,而真正能交付项目的 大模型应用开发工程师 **,**却极度稀缺!

落地AI应用绝对不是写几个prompt,调几个API就能搞定的,企业真正需要的,是能搞定这三项核心能力的人:

✅RAG:融入外部信息,修正模型输出,给模型装靠谱大脑

✅Agent智能体:让AI自主干活,通过工具调用(Tools)环境交互,多步推理完成复杂任务。比如做智能客服等等……

✅微调:针对特定任务优化,让模型适配业务

目前,脉脉上有超过1000家企业发布大模型相关岗位,人工智能岗平均月薪7.8w!实习生日薪高达4000!远超其他行业收入水平!

技术的稀缺性,才是你「值钱」的关键!

具备AI能力的程序员,比传统开发高出不止一截!有的人早就转行AI方向,拿到百万年薪!👇🏻👇🏻

图片

AI浪潮,正在重构程序员的核心竞争力!现在入场,仍是最佳时机!

我把大模型的学习全流程已经整理📚好了!抓住AI时代风口,轻松解锁职业新可能,希望大家都能把握机遇,实现薪资/职业跃迁~

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

在这里插入图片描述

⭐️从大模型微调到AI Agent智能体搭建

剖析AI技术的应用场景,用实战经验落地AI技术。从GPT到最火的开源模型,让你从容面对AI技术革新!

大模型微调

  • 掌握主流大模型(如DeepSeek、Qwen等)的微调技术,针对特定场景优化模型性能。

  • 学习如何利用领域数据(如制造、医药、金融等)进行模型定制,提升任务准确性和效率。

RAG应用开发

  • 深入理解检索增强生成(Retrieval-Augmented Generation, RAG)技术,构建高效的知识检索与生成系统。
  • 应用于垂类场景(如法律文档分析、医疗诊断辅助、金融报告生成等),实现精准信息提取与内容生成。

AI Agent智能体搭建

  • 学习如何设计和开发AI Agent,实现多任务协同、自主决策和复杂问题解决。
  • 构建垂类场景下的智能助手(如制造业中的设备故障诊断Agent、金融领域的投资分析Agent等)。

图片

如果你也有以下诉求:

快速链接产品/业务团队,参与前沿项目

构建技术壁垒,从竞争者中脱颖而出

避开35岁裁员危险期,顺利拿下高薪岗

迭代技术水平,延长未来20年的新职业发展!

……

那这节课你一定要来听!

因为,留给普通程序员的时间真的不多了!

立即扫码,即可免费预约

「AI技术原理 + 实战应用 + 职业发展

「大模型应用开发实战公开课」

👇👇

在这里插入图片描述

👍🏻还有靠谱的内推机会+直聘权益!!

完课后赠送:大模型应用案例集、AI商业落地白皮书

Logo

小龙虾开发者社区是 CSDN 旗下专注 OpenClaw 生态的官方阵地,聚焦技能开发、插件实践与部署教程,为开发者提供可直接落地的方案、工具与交流平台,助力高效构建与落地 AI 应用

更多推荐