AI核心组件解析:LLM、Agent、MCP与Skills
本文解析了AI系统的四大核心组件:LLM(大语言模型)、Agent(智能体)、Skills(技能)和MCP(模型上下文协议)。LLM作为AI的"大脑",提供语言理解和生成能力;Agent是执行中枢,负责任务分解和决策;Skills扩展LLM能力边界,实现具体功能;MCP则是标准化协议,实现组件间的互操作性。文章还阐述了各组件的关系,并以OpenClaw为例说明实际应用。这些组件
AI核心组件解析:LLM、Agent、MCP与Skills

1. LLM(大语言模型)
含义
LLM 是 AI 系统的 “大脑”。它是一个在海量文本数据上训练出来的深度学习模型,能够理解、生成和操作人类语言。其核心能力是基于输入的文本(提示词),预测并生成下一个最合适的词,从而形成完整的回复。
在架构中的作用
LLM 提供了智能决策、逻辑推理、语言理解和生成的核心能力。它本身是一个 “静态” 的模型,接收文本输入,返回文本输出。
原理
Transformer 架构
几乎所有现代 LLM 都基于 Transformer 架构,其核心是自注意力机制,允许模型在处理一个词时,同时考虑句子中所有其他词与它的关系,从而深刻理解上下文。
预训练 + 微调
预训练:模型在海量、无标注的数据上进行学习,通过“预测下一个词”的任务,掌握语法、事实、推理能力和世界知识。这个阶段产生了模型的基础能力。
微调:预训练完成后,使用有标注的数据对模型进行微调,使其更好地遵循指令、进行对话,并符合人类的偏好。
2. Agent(智能体)
含义
Agent 是一个以 LLM 为大脑的 自主执行系统。它不仅是问答机器人,更是一个能够感知环境、进行决策并采取行动来完成特定目标的实体。Agent 让 LLM 从 “思想者” 变成了 “行动者”。
在架构中的作用
Agent 是整个系统的 “执行中枢” 或 “调度器”。它负责任务分解、规划、决策,并决定何时以及如何调用各种工具(Skills)。
原理
Agent 的工作流程通常遵循一个循环,常被称为 ReAct (Reason + Act) 模式:
思考(Reason):LLM 分析当前的任务和目标,思考下一步该做什么才能接近目标。
行动(Act):LLM 生成一个具体的指令,通常是调用一个外部工具(例如搜索天气、计算数学题、发送邮件)。
观察(Observe):Agent 执行该行动(调用工具),获取返回的结果,并将观察结果反馈给 LLM。
循环:LLM 再次思考,决定下一步行动,如此循环,直到最终完成任务。
问题:Claude Code 和 OpenClaw 是 Agent 吗?
两者都属于 AI Agent 的范畴。 它们都超越了传统聊天机器人的“问答”模式,具备了“感知-思考-行动”的自主闭环能力。
Claude Code:作为一个以代码为核心交互的 Agent,它可以理解代码库、生成代码、执行命令等。
OpenClaw:同样是一个 Agent,它通过 LLM 驱动,能够根据指令调用本地技能或通过 MCP 连接外部工具,完成复杂任务。
3. Skills(技能/工具)
含义
Skills 是 Agent 可以调用的 具体能力单元。每个 Skill 都封装了实现逻辑,具有明确的输入和输出。例如:
一个可以计算数学表达式的函数:calculate(expression)
一段能查询数据库的 Python 脚本
一个能发送邮件的 API 调用
在架构中的作用
Skills 是 Agent 的 “手脚”,极大地扩展了 LLM 的能力边界,使其能够获取实时信息、进行计算、操作软件、控制硬件等,从而完成复杂的现实世界任务。
4. MCP(模型上下文协议)
含义
MCP 是一个 标准化的通信协议,就像 AI 世界的 USB-C 接口。它定义了:
Agent 如何发现可用的 Skills(服务发现)
如何调用这些 Skills(请求格式、参数传递)
如何接收结果(响应格式)
在架构中的作用
MCP 起到了 “万能插座” 和 “服务发现” 的作用。它让 Agent 的构建不再与具体的 Skill 实现强耦合。开发者可以为各种数据源和工具创建 MCP 服务器,任何兼容 MCP 的 Agent 都能即时、无缝地使用它们。这大大提升了 AI 生态系统的互操作性和可扩展性。
5. 核心关系
MCP 为 Skills 提供了一层“包装”,使它们可以被任何兼容 MCP 的 Agent 发现和调用。
一个 Skill 可以直接被 Agent 调用(硬编码),也可以通过 MCP 服务器暴露出来,实现即插即用。
在 MCP 的架构中,Skill 是 MCP 服务器的 内部实现,而 MCP 服务器是 Skill 的 对外接口。
6. 在 OpenClaw 中的体现
Skills:可以是本地的 Markdown 指令文件(SKILL.md)或可执行脚本。
MCP:允许 OpenClaw 通过配置 MCP 服务器(如 github-tools 服务器)来获取更多外部技能。此时,这些服务器内部的技能就是通过 MCP 暴露给 Agent 的。
两者并存互补:本地 Skill 适合快速实现简单任务,MCP 连接的 Skill 适合复用社区生态、集成复杂服务。

更多推荐

所有评论(0)