目录

1.LLM大模型

核心定义与架构

2.数据处理单元:Token

核心特性

Token 与自然语言单位的关系

量化参考

3.context上下文(临时记忆体)

核心概念

主流模型 Context Window 对比

context Window上下文窗口

4.RAG

5.Prompt提示词

定义与分类

Prompt Engineering 提示词工程

6. 外部能力扩展:Tool

核心作用

工作流程

角色分工

7.工具标准化:MCP

8.自主决策系统:Agent

9. 任务定制:Agent Skill

核心功能

技术实现

10.总结

「概念体系层级关系」

补充细节


1.LLM大模型

核心定义与架构

  • LLM 全称:Large Language Model(大语言模型),简称大模型
  • 底层架构:基于 Transformer(2017 年 Google 团队在论文《Attention is All You Need》中提出)
  • 工作原理:本质是文字接龙游戏,通过预测下一个概率最高的词生成连续文本。
  • 发展里程碑

时间

事件

意义

2017 年

Transformer 架构提出

奠定大模型技术基础

2022 年底

GPT-3.5 发布

首个达到可用级别的大模型

2023 年 3 月

GPT-4 发布

大幅提升 AI 能力天花板

2023 年后

Claude、Gemini 等模型涌现

AI 赛道从 OpenAI 独角戏变为多强竞争

2.数据处理单元:Token

核心特性

  • 定义:大模型处理文本的最小单位,通过 Tokenizer(分词器)将文本切分为片段
  • 编码过程:分两步 ——①文本切分为 Token ②映射为 Token ID(数字)
  • 解码过程:将 Token ID 还原为文本(无需切分步骤)

Token 与自然语言单位的关系

表格

语言单位

与 Token 的关系

示例

中文词语

非一一对应,可能被拆分

“工作坊”→“工作”+“坊”

英文单词

常见词通常对应 1 个 Token

“hello”→1 个 Token

复杂单词

可能被拆分

“helpful”→“help”+“ful”

特殊字符

可能需多个 Token 表示

“✅”→3 个 Token

量化参考

  • 1 个 Token ≈ 0.75 个英文单词
  • 1 个 Token ≈ 1.5-2 个汉字
  • 40 万 Token ≈ 60-80 万汉字 或 30 万英文单词

所以token是大模型处理文本的最基本单元。

token和词并没有什么明确的一一对应的关系,可以把token理解成 模型自己学会的一套文本切分规则,切出来的每一块就是它一次能够处理的最小单位;

3.context上下文(临时记忆体)

核心概念

  • 定义:大模型每次处理任务时接收的信息总和,相当于模型的 "临时记忆"
  • 组成部分:用户问题、对话历史、当前输出 Token、工具列表、System Prompt 等
  • 容量限制:由 Context Window(上下文窗口)定义,即最大可处理的 Token 数量

主流模型 Context Window 对比

表格

模型

Context Window(Token)

约合汉字数量

GPT-5.4

105 万

约 157.5 万

Gemini 3.1 Pro

100 万

约 150 万

Claude Opus 4.6

100 万

约 150 万

context就是大模型每次处理任务时所接收到的信息总和

context多大,能塞多少token?

context Window上下文窗口

代表:context能容纳的最大【token数量】

4.RAG

突破 Context Window 限制的方案

  • RAG 技术(检索增强生成):从知识库中抽取与问题最相关的片段,仅将关键信息送入模型,降低 Token 消耗

retrieval-augmented generation 检索增强生成

先从资料库里检索相关内容,再基于这些内容来生成答案

5.Prompt提示词

含义:大模型接收的具体问题或指令。

定义与分类

  • Prompt:给大模型的问题或指令,决定模型输出质量
  • Prompt 分类
    • User Prompt:用户输入的具体任务(如 "帮我写一首诗")
    • System Prompt:开发者后台配置的人设与做事规则(如 "你是一个耐心的数学老师,当学生问你数学问题时,不要直接给答案,而是要一步步引导学生思考,帮助他们理解解题的思路")

Prompt Engineering 提示词工程

  • 核心原则:清晰、具体、明确
  • 现状:曾经重要,但现在重要性下降,原因
  • ①门槛低(本质是 "把话说清楚")②大模型能力提升,可推测模糊意图

6. 外部能力扩展:Tool

核心作用

  • 定义:大模型调用的外部函数,使其能够感知和影响外部环境
  • 解决痛点:弥补大模型无法获取实时信息(如天气)、计算能力有限等弱点

工作流程

  1. 用户提问→平台转发(含工具列表)
  2. 大模型分析→生成工具调用指令
  3. 平台执行调用→获取结果
  4. 大模型整理结果→自然语言输出

角色分工

表格

角色

职责

大模型

选择工具、生成参数、归纳结果

工具

执行具体功能(如查询天气)

平台

转发信息、执行工具调用

有人可能以为调用工具的是模型,但是模型能做到的仅仅是输出一段文本,告诉平台它想要调用哪个工具,调用工具最终是由平台来完成的。

tool本质就是给大模型提供一套它可以调用的外部能力,让大模型能够感知和影响外部环境。

7.工具标准化:MCP

  • 全称:Model Context Protocol(模型上下文协议)
  • 本质:理解为统一的工具接入标准,解决不同平台工具接入规范不统一的问题
  • 比如:openAI、Anthropic、Google 三个平台各自有接入规范,用一个要写一个接入规范。所以想搞一个统一的技术规范标准
  • 就像手机都统一用 type c 充电口统一标准
  • 价值:工具开发者只需按 MCP 规范开发一次,即可在所有支持 MCP 的平台使用(类比手机 Type-C 接口)

model context protocol 模型上下文协议,统一的工具接入标准

平台需要:1.平台要把工具列表传给模型;2.能调用工具;

要做到这些,首先要把工具接入到平台里面,这样平台才知道可用工具列表以及每个工具的用途,参数和调用方法等等。

问题是:这套接入的规范每个平台都不一样,

如果用的是chatgpt,得按照openAI的规范接入工具,写一套接入代码;

如果用的是Claude,得按照Anthropic的规范接入,再写一套接入代码;

如果用的是Gemimi,得按照Google的规范接入,再写一套接入代码。

同一个工具要写3遍,因为每个平台的接入规范都不一样,所以能不能搞一个统一的标准,让所有平台都遵循这个标准,这样工具的开发者只需要写一次代码,就可以在所有平台上使用了。

这个就是MCP由来。

大模型借助工具感知外部世界,工具又可以使用MCP这种方式统一接入。

8.自主决策系统:Agent

  • Agent 定义:能够自主规划、自主调用工具,持续工作直至完成用户任务的系统
  • 核心能力:多步骤推理、工具选择、流程控制
  • 代表产品:Claude Code、Codex、Gemini CLI 等
  • 典型构建模式:React、Plan and Execute 等

能够自主规划,自主调用工具 直至完成用户任务的系统为Agent

9. 任务定制:Agent Skill

含义:本质上就是你提前写好塞给Agent的一份说明文档。

核心功能

  • 定义:给 Agent 的说明文档,包含任务规则、执行步骤、输出格式等
  • 结构
    • 元数据层:名称(name)、描述(description)、示例
    • 指令层:目标、执行步骤、判断规则、输出格式、示例

技术实现

  • 存储形式:Markdown 文档(文件名必须为SKILL.md
  • 存放位置:特定目录(如 Claude Code 找到用户目录的claude/skills文件夹)
  • 加载机制:仅在用户问题与技能名称 / 描述相关时加载完整指令

10.总结

「概念体系层级关系」

LLM(核心引擎)→ Token(数据单元)→ Context(记忆空间)→ Prompt(交互接口)→ Tool(外部能力)→ MCP(工具标准)→ Agent(决策系统)→ Agent Skill(任务定制)

补充细节

  • Transformer 架构:虽由 Google 提出,但由 OpenAI 通过 GPT 系列引爆应用
  • Token 切分原理:基于 BPE(字节对编码)算法,模型自主学习文本切分规则
  • Agent Skill 高级特性:支持运行代码、引用资源,采用渐进式披露机制节省 Token
  • RAG 技术:通过检索相关片段而非全文,有效解决 Context Window 限制问题

Logo

小龙虾开发者社区是 CSDN 旗下专注 OpenClaw 生态的官方阵地,聚焦技能开发、插件实践与部署教程,为开发者提供可直接落地的方案、工具与交流平台,助力高效构建与落地 AI 应用

更多推荐