大模型核心概念--LLM→Token→Context→Prompt→Tool→MCP→Agent→AgentSkill

时间	事件	意义
2017 年	Transformer 架构提出	奠定大模型技术基础
2022 年底	GPT-3.5 发布	首个达到可用级别的大模型
2023 年 3 月	GPT-4 发布	大幅提升 AI 能力天花板
2023 年后	Claude、Gemini 等模型涌现	AI 赛道从 OpenAI 独角戏变为多强竞争

2.数据处理单元：Token

核心特性

定义：大模型处理文本的最小单位，通过 Tokenizer（分词器）将文本切分为片段
编码过程：分两步 ——①文本切分为 Token ②映射为 Token ID（数字）
解码过程：将 Token ID 还原为文本（无需切分步骤）

Token 与自然语言单位的关系

表格

语言单位	与 Token 的关系	示例
中文词语	非一一对应，可能被拆分	“工作坊”→“工作”+“坊”
英文单词	常见词通常对应 1 个 Token	“hello”→1 个 Token
复杂单词	可能被拆分	“helpful”→“help”+“ful”
特殊字符	可能需多个 Token 表示	“✅”→3 个 Token

量化参考

1 个 Token ≈ 0.75 个英文单词
1 个 Token ≈ 1.5-2 个汉字
40 万 Token ≈ 60-80 万汉字或 30 万英文单词

所以token是大模型处理文本的最基本单元。

token和词并没有什么明确的一一对应的关系，可以把token理解成模型自己学会的一套文本切分规则，切出来的每一块就是它一次能够处理的最小单位；

3.context上下文（临时记忆体）

核心概念

定义：大模型每次处理任务时接收的信息总和，相当于模型的 "临时记忆"
组成部分：用户问题、对话历史、当前输出 Token、工具列表、System Prompt 等
容量限制：由 Context Window（上下文窗口）定义，即最大可处理的 Token 数量

主流模型 Context Window 对比

表格

模型	Context Window（Token）	约合汉字数量
GPT-5.4	105 万	约 157.5 万
Gemini 3.1 Pro	100 万	约 150 万
Claude Opus 4.6	100 万	约 150 万

context就是大模型每次处理任务时所接收到的信息总和

context多大，能塞多少token？

context Window上下文窗口

代表：context能容纳的最大【token数量】

4.RAG

突破 Context Window 限制的方案

RAG 技术（检索增强生成）：从知识库中抽取与问题最相关的片段，仅将关键信息送入模型，降低 Token 消耗

retrieval-augmented generation 检索增强生成

先从资料库里检索相关内容，再基于这些内容来生成答案

5.Prompt提示词

含义：大模型接收的具体问题或指令。

定义与分类

Prompt：给大模型的问题或指令，决定模型输出质量
Prompt 分类：

- User Prompt：用户输入的具体任务（如 "帮我写一首诗"）
- System Prompt：开发者后台配置的人设与做事规则（如 "你是一个耐心的数学老师，当学生问你数学问题时，不要直接给答案，而是要一步步引导学生思考，帮助他们理解解题的思路"）

Prompt Engineering 提示词工程

核心原则：清晰、具体、明确
现状：曾经重要，但现在重要性下降，原因
①门槛低（本质是 "把话说清楚"）②大模型能力提升，可推测模糊意图

6. 外部能力扩展：Tool

核心作用

定义：大模型调用的外部函数，使其能够感知和影响外部环境
解决痛点：弥补大模型无法获取实时信息（如天气）、计算能力有限等弱点

工作流程

用户提问→平台转发（含工具列表）
大模型分析→生成工具调用指令
平台执行调用→获取结果
大模型整理结果→自然语言输出

角色分工

表格

角色	职责
大模型	选择工具、生成参数、归纳结果
工具	执行具体功能（如查询天气）
平台	转发信息、执行工具调用

有人可能以为调用工具的是模型，但是模型能做到的仅仅是输出一段文本，告诉平台它想要调用哪个工具，调用工具最终是由平台来完成的。

tool本质就是给大模型提供一套它可以调用的外部能力，让大模型能够感知和影响外部环境。

7.工具标准化：MCP

全称：Model Context Protocol（模型上下文协议）
本质：理解为统一的工具接入标准，解决不同平台工具接入规范不统一的问题
比如：openAI、Anthropic、Google 三个平台各自有接入规范，用一个要写一个接入规范。所以想搞一个统一的技术规范标准
就像手机都统一用 type c 充电口统一标准
价值：工具开发者只需按 MCP 规范开发一次，即可在所有支持 MCP 的平台使用（类比手机 Type-C 接口）

model context protocol 模型上下文协议，统一的工具接入标准

平台需要：1.平台要把工具列表传给模型；2.能调用工具；

要做到这些，首先要把工具接入到平台里面，这样平台才知道可用工具列表以及每个工具的用途，参数和调用方法等等。

问题是：这套接入的规范每个平台都不一样，

如果用的是chatgpt,得按照openAI的规范接入工具，写一套接入代码；

如果用的是Claude,得按照Anthropic的规范接入，再写一套接入代码；

如果用的是Gemimi,得按照Google的规范接入，再写一套接入代码。

同一个工具要写3遍，因为每个平台的接入规范都不一样，所以能不能搞一个统一的标准，让所有平台都遵循这个标准，这样工具的开发者只需要写一次代码，就可以在所有平台上使用了。

这个就是MCP由来。

大模型借助工具感知外部世界，工具又可以使用MCP这种方式统一接入。

8.自主决策系统：Agent

Agent 定义：能够自主规划、自主调用工具，持续工作直至完成用户任务的系统
核心能力：多步骤推理、工具选择、流程控制
代表产品：Claude Code、Codex、Gemini CLI 等
典型构建模式：React、Plan and Execute 等

能够自主规划，自主调用工具直至完成用户任务的系统为Agent

9. 任务定制：Agent Skill

含义：本质上就是你提前写好塞给Agent的一份说明文档。

核心功能

定义：给 Agent 的说明文档，包含任务规则、执行步骤、输出格式等
结构：

- 元数据层：名称（name）、描述（description）、示例
- 指令层：目标、执行步骤、判断规则、输出格式、示例

技术实现

存储形式：Markdown 文档（文件名必须为SKILL.md）
存放位置：特定目录（如 Claude Code 找到用户目录的claude/skills文件夹）
加载机制：仅在用户问题与技能名称 / 描述相关时加载完整指令

10.总结

「概念体系层级关系」

LLM（核心引擎）→ Token（数据单元）→ Context（记忆空间）→ Prompt（交互接口）→ Tool（外部能力）→ MCP（工具标准）→ Agent（决策系统）→ Agent Skill（任务定制）

补充细节

Transformer 架构：虽由 Google 提出，但由 OpenAI 通过 GPT 系列引爆应用
Token 切分原理：基于 BPE（字节对编码）算法，模型自主学习文本切分规则
Agent Skill 高级特性：支持运行代码、引用资源，采用渐进式披露机制节省 Token
RAG 技术：通过检索相关片段而非全文，有效解决 Context Window 限制问题

龙虾开发者社区

小龙虾开发者社区是 CSDN 旗下专注 OpenClaw 生态的官方阵地，聚焦技能开发、插件实践与部署教程，为开发者提供可直接落地的方案、工具与交流平台，助力高效构建与落地 AI 应用

更多推荐

快速上手OpenClaw：数据抓取全攻略

《OpenClaw入门指南》摘要：OpenClaw是一款轻量级开源自动化工具，专注于数据抓取和任务调度。安装简单，通过pip即可完成。核心功能包括网页抓取（支持XPath/CSS选择器）、动态页面处理（集成Selenium）、数据存储（如SQLite）和任务调度（如结合APScheduler）。工具提供异常处理机制保障稳定性，适合快速实现从基础抓取到定时任务等场景。通过简洁的Python API，

龙虾开发者社区

AI Agent 到底是做什么的？优势在哪里？

AI Agent 能将大模型的语言能力转化为自主执行复杂任务的行动力（如：自动分析数据、跨系统调度资源），显著提升效率（企业级应用平均节省30%人力成本）；同时，随着 AI 从“辅助工具”升级为“决策主体”，掌握其设计逻辑（如：工作流编排、多智能体协作）已成为职场分水岭——技术岗位需避免沦为低价值调参，非技术岗位则需通过定义目标释放决策时间（如：自动生成周报可减少 70% 事务性工作）。当前学习窗

龙虾开发者社区

.Net基于NetCoreKevin框架 AI 与 Hangfire 集成：实现AI智能自动任务调度

NetCoreKevin 是一个 AI Agent 框架，内置了丰富的工具（如 HTTP 请求、Python 执行、Shell 命令等）。通过集成 Hangfire 分布式任务调度库，AI 能够自主创建、管理和触发周期性自动任务，让智能体不仅能实时响应，还能按预定计划自动完成日常工作（如定时生成报告、数据同步、内容总结等）。本文将详细介绍如何在 NetCoreKevin 中实现 AI 与 Hang