十分钟搞懂 AI 时代核心概念:OpenClaw、Agent、Skill、Token、LLM 到底是什么?
一文读懂 AI 时代核心概念:OpenClaw、Agent、Skill、Token、LLM 到底是什么?从小白到入门,看这篇就够了。
十分钟搞懂 AI 时代核心概念:OpenClaw、Agent、Skill、Token、LLM 到底是什么?
你有没有遇到过这种情况——别人聊天时提到"Agent"、"Token"、"Skill"这些词,你感觉自己在听天书?
别慌,今天我用最通俗的方式,带你一次性搞懂这些概念,以及它们之间的关系。
先从最基础的开始:大语言模型(LLM)
大语言模型,英文缩写是 LLM,你可以把它理解为 AI 领域的"超级大脑”。
你可以想象一个读遍了全世界所有图书馆的学者,什么都懂一点。你问它问题,它能理解你的意思并给出回答。GPT-4、Claude、 Gemini、文心一言、通义千问,这些都是大语言模型。
在 OpenClaw 里,当前使用的模型是 MiniMax-M2.5,这就是它的"大脑”,负责思考和回答问题。
Token:语言的"像素”
Token 这个词有两种含义,你得区分清楚:
第一种:词元。这是语言模型处理文本的最小单位。比如"你好"这两个字,在 LLM 眼里可能是 2 个 Token。为啥?因为模型不直接"看”字,而是把文字切成一个个小碎片来处理。
第二种:令牌。这是访问系统的"身份证”,比如你调用某个 API 时需要用的 API Token。
为什么 Token 很重要?因为它是 LLM 的"粮食”。模型一次只能处理固定数量的 Token,这叫"上下文窗口”。而且对开发者来说,Token = 费用——你用的越多,收费越多。
简单理解:把 Token 想象成语言的"像素”。一张图片由无数像素组成,一段文字由无数 Token 组成。LLM 每次"看”文章,只能看固定数量的"像素”。
Agent:能千活的 AI
Agent,中文叫"智能体”。这是 AI 时代最重要的概念之一。
普通的 AI 只能回答问题,比如你问 ChatGPT"今天天气怎么样”,它会告诉你。而 Agent 不仅能回答,还能自主决策和执行。
举个例子:
- 普通 AI:你问"帮我订一张去北京的机票”,它会告诉你怎么订。
- Agent:你说"帮我订一张去北京的机票”,它真的会去查航班、比较价格、完成下单。
这就是区别——Agent 有"手脚”,不只是动脑。
Agent 的核心能力包括四个方面:
- 感知——接收信息(用户消息、文件、环境状态)
- 思考——分析问题、制定计划
- 行动——执行操作(发送消息、读写文件、调用工具)
- 学习——从经验中改进
在 OpenClaw 里,当前运行环境就是 agent=main,OpenClaw 本身就是一个 Agent 运行环境。
Skill:Agent 的工具箱
Skill,中文叫"技能”。如果说 Agent 是"通用人才”,那 Skill 就是"专业证书”。有了某个 Skill,Agent 就能做特定的事情。
举几个 OpenClaw 中的 Skill 例子:
- feishu-doc:读写飞书文档
- feishu-wiki:管理飞书知识库
- browser:浏览器自动化
- weather:查询天气
- skill-creator:创建新技能
这就像什么?传统开发是你要写代码、编译、运行,很麻烦。而有了 Skill,就像安装了一个 App,Agent 自动就会用这个功能。
OpenClaw:AI 手机的"操作系统”
OpenClaw 是一个 AI Agent 运行环境,你可以把它理解成 AI 手机的"操作系统”。
- OpenClaw = 安卓系统
- Agent = 手机上的 App
- Skill = App 的功能插件
OpenClaw 让 Agent 能够:
- 接收和发送消息(飞书、Discord、Telegram 等)
- 调用各种工具(浏览器、文件、API)
- 使用 Skills 扩展能力
- 持久化记忆
Claude Code:编程专用 Agent
Claude Code 是 Anthropic 公司推出的 AI 编程助手,专门帮助开发者:
- 编写和调试代码
- 执行终端命令
- 操作文件
- 自动化开发流程
它和普通对话版 Claude 的区别在于:普通版是通用 AI 助手,而 Claude Code 是专门为编程场景优化的 Agent。
它们是怎么配合干活的?
说了这么多概念,它们实际是怎么配合工作的?让我举个例子:
场景:用户问"今天天气怎么样?”
- 用户发送消息"今天天气怎么样?”
- OpenClaw 接收消息,交给 Agent 处理
- Agent 理解用户意图:需要查询天气
- Agent 调用 Skill: weather(天气技能)
- weather Skill 调用外部天气 API
- 返回天气信息给 Agent
- Agent 调用 LLM 整理回答
- OpenClaw 把回答发送给用户
这就是完整的工作流程!
一张图看懂层次关系
如果你还是觉得抽象,我给你一个简单的类比:
| 概念 | 类比 | 角色 |
|---|---|---|
| LLM | 人类的大脑 | 负责思考和理解 |
| Token | 语言的像素 | 信息的基本单位 |
| Agent | 公司的员工 | 决策和执行者 |
| Skill | 员工的证书 | 专业能力 |
| OpenClaw | 公司的办公系统 | 运行平台 |
| Claude Code | 专业编辑器 | 专用工具 |
小结
今天我们聊了六个核心概念:
- LLM 是基础——负责理解和生成语言,是所有 AI 的"大脑”
- Token 是燃料——LLM 处理信息的单位,也用于计费
- Agent 是执行者——让 AI 不仅能想,还能做
- Skill 是插件——给 Agent 赋予各种专业能力
- OpenClaw 是平台——让 Agent 能够运行并与外界交互
- Claude Code 是具体产品——专门用于编程的 Agent
一句话概括:
OpenClaw 是一个"AI Agent 操作系统”,它让 Agent(内置 LLM 作为大脑)通过 Skills(技能)来执行任务,并与外部世界交互。
现在,你可以出去和别人聊这些概念了!
本文适合:对 AI 感兴趣但不知道从哪开始的小白
更多推荐

所有评论(0)