LLM、Token、RAG、MCP……这10个AI名词,一张图给你讲明白

AI入门科普 · 第1篇
LLM、Token、RAG、MCP……这10个AI名词,一张图给你讲明白
程序猿Joe · 2026-06-29
大家好,我是程序猿Joe。
前两天有个读者私信我:“Joe哥,我看AI文章的时候,满屏都是 LLM、Token、Prompt、RAG、MCP、Agent……这些词到底啥意思?每个都懂一点,但串起来就懵了。”
说实话,我刚接触AI那会儿也是这样。看一篇技术博客,查3次百度百科,结果越查越乱。直到我把这些名词串成一条"AI进化链",才发现它们根本不是孤立的,而是一层层叠加起来的。
今天就用最接地气的方式,把这10个最常见的AI名词一次性讲清楚。看完这篇,你再看任何AI文章都不会卡壳了。建议先收藏。
一、一切的开始:LLM,AI的"大脑"
**LLM(Large Language Model,大语言模型)**就是AI的"大脑"。
你可以把它想象成一个读了海量书籍的超级学霸。它通过学习万亿级别的文字,掌握了语言的规律。你输入一句话,它其实是在"预测"下一句最可能是什么——只不过它预测得特别准,准到看起来像"理解"了你说的话。
我们熟知的 ChatGPT、Claude、DeepSeek,背后都是 LLM。
一句话:LLM 是地基。后面所有的AI能力,都建立在这个"大脑"之上。
二、大脑怎么"读"文字?Token
LLM 不是直接读"字"或"单词"的。它读的是 Token。
Token 是AI处理文字时的最小单位。中文里,1个字通常是1个Token;英文里,1个单词可能被拆成2-3个Token(比如 “unbelievable” 会被拆成 “un” + “believ” + “able”)。
为啥要拆?因为AI的"脑容量"是有限的,用Token来计量最省空间。就像快递打包,把衣服叠成方块比一团塞进去更省地方。
记住一个原则:Token 越少,AI处理越快、越便宜。所以写 Prompt 时,精简文字就是在省钱。
三、怎么跟大脑对话?Prompt
**Prompt(提示词)**就是你对AI说的"指令"。
但同样一个大脑,你问"写个代码"和问"你是一个10年经验的Python工程师,请用Flask写一个带JWT认证的RESTful API,要求包含单元测试",得到的答案天差地别。
**Prompt Engineering(提示词工程)**就是研究"怎么把话说清楚"的学问。它不是什么高深技术,核心就一句话:给AI越明确的上下文和约束,它输出越精准。
举个生活中的例子
你让同事"帮买个外卖",他可能买错。但你说明"帮我点一份少油少盐的黄焖鸡,加一份米饭,送到3楼会议室,12点前到",成功率就高得多。Prompt Engineering 就是让你的指令从模糊变精确的过程。
四、大脑能"记住"多少?Context 和 Memory
LLM 有个很大的限制:它没有真正的长期记忆。
**Context(上下文)**是AI在当前对话里能"看到"的内容。比如你跟ChatGPT聊了半天,它之所以能接上你的话,是因为你把之前的聊天记录都发给了它——这些内容就是 Context。但这个窗口是有限的,超过上限,早期的内容就会被"遗忘"。
**Memory(记忆)**则是想办法让AI"记住"你。比如ChatGPT的"记忆功能",会把你的偏好存起来,下次对话时自动带入。
划重点:Context 是"短期记忆",有容量上限;Memory 是"长期记忆",需要额外的存储机制来实现。
五、大脑能产出什么?AIGC
**AIGC(AI Generated Content,生成式AI内容)**就是AI"生产"出来的所有东西。
文字(文章、代码、邮件)、图片(Midjourney、Stable Diffusion)、视频(Sora)、音乐(Suno)——这些都是AIGC。本质上是LLM这个"大脑"把学到的知识"重新组合"后输出的结果。
你可以把AIGC理解为大脑的**“表达能力”**。会聊天、会画图、会写歌,都是同一个大脑在不同领域的"才艺展示"。
六、大脑怎么查资料?RAG
LLM 有个致命问题:它会"一本正经地胡说八道",专业术语叫"幻觉"(Hallucination)。
为什么?因为它的知识来自训练数据,有截止日期,而且可能记错。**RAG(Retrieval-Augmented Generation,检索增强生成)**就是解决这个问题的。
核心思路特简单:先查资料,再回答。
比如你问AI"我们公司今年的销售数据怎么样",RAG会先到你的内部文档/数据库里检索相关内容,把找到的资料"喂"给AI,然后让AI基于这些资料来回答。这样AI就不会瞎编了。
| 方式 | 原理 | 缺点 |
|---|---|---|
| 纯LLM | 靠训练数据里的记忆回答 | 知识过时、容易幻觉 |
| RAG | 先检索外部资料,再基于资料生成 | 检索质量决定回答质量 |
七、大脑怎么"用手"?MCP
到目前为止,我们的AI还只能"动嘴"——回答问题、生成内容。但如果想让它真正干活呢?比如查数据库、发邮件、操作文件?
MCP(Model Context Protocol,模型上下文协议)就是解决这个问题的。它是Anthropic提出的一套开放标准,相当于AI和外部工具之间的"USB-C接口"。
以前,你想让AI操作你的数据库,得写一堆集成代码。现在有了MCP,只要数据库提供了MCP Server,任何支持MCP的AI(Cursor、VS Code Copilot、ChatGPT等)都能直接调用——一次配置,到处使用。
一句话:MCP 让 AI 从"会说话"变成了"能动手"。
八、大脑的"专业技能":Skill
**Skill(技能)**可以理解为AI被额外训练出来的一种专门能力。
打个比方:LLM本身是个"通才",但如果你想让它专门帮你做代码审查、写测试用例、或者分析财务报表,你可以给它训练一个 Skill。这个Skill里包含了特定的知识、工具和流程。
在MCP生态里,Skill通常指的是一组预定义好的工具组合+提示词模板。比如"前端开发助手"这个Skill,可能包含了读写文件、查询文档、运行测试等一系列工具,以及对应的Prompt模板。
九、从"被动回答"到"主动做事":Agent
普通AI聊天是**“你问一句,它答一句”**——被动模式。
Agent(智能体)则是"你给一个目标,它自己想办法完成"——主动模式。
比如你跟Agent说:"帮我调研一下竞品最近三个月的功能更新,整理成一份报告发到我的邮箱。"Agent会自己分解任务:
- ① 搜索竞品官网和更新日志
- ② 整理关键功能点
- ③ 生成报告文档
- ④ 调用邮件工具发送
整个过程不需要你一步步指挥,Agent自己规划、执行、调整。Agent = LLM大脑 + MCP手脚 + Skill专业技能 + 自主规划能力。
十、管理一群AI干活:Harness Engineering
当AI能主动做事之后,新的问题出现了:怎么让一堆AI、工具、工作流稳定地协同工作,不出乱子?
**Harness Engineering(驾驭工程)**就是解决这个问题的。它是一套工程方法论,核心思想是:给AI系统加上"缰绳"和"马鞍"——既要让它跑得快,又要保证不跑偏。
具体来说,包括监控AI的执行过程、设置安全边界、处理异常情况、评估输出质量等。就像你不会让一个刚学会开车的实习生独自上高速,Harness Engineering 就是给AI系统上的"保险"和"导航系统"。
一张图串起来:AI的进化链
看完这10个名词,你可能会觉得信息量很大。但如果把它们串成一条链,逻辑就清晰了:
- LLM = 大脑(基础能力)
- Token = 大脑处理信息的方式
- Prompt = 跟大脑说话的语言
- Context/Memory = 大脑的记忆力
- AIGC = 大脑的产出物
- RAG = 大脑查资料的能力
- MCP = 大脑操作外部工具的手
- Skill = 大脑的专业技能包
- Agent = 有大脑、有手、有技能,能自主干活的"人"
- Harness Engineering = 管理这群"人"干活的工程方法
| 层级 | 对应名词 | 类比 |
|---|---|---|
| 基础层 | LLM、Token | 大脑 + 思维方式 |
| 交互层 | Prompt、Context、Memory | 说话方式 + 记忆力 |
| 产出层 | AIGC、RAG | 创作能力 + 查资料能力 |
| 扩展层 | MCP、Skill | 手 + 专业技能 |
| 应用层 | Agent、Harness Engineering | 完整的人 + 管理团队 |
常见误区(我踩过的坑)
误区1:这些名词是互斥的,学了A就不用学B
恰恰相反,它们是层层叠加的关系。你理解LLM,才能更好地写Prompt;会写Prompt,才能用好RAG;有了RAG和MCP,才能搭出Agent。别想着跳过基础直接上Agent,地基不牢会摔得很惨。
误区2:AIGC就是聊天机器人
AIGC的范围远不止文字聊天。图片、视频、音频、代码、3D模型……只要AI"生成"出来的东西,都叫AIGC。聊天只是其中一种形式。
误区3:有了Agent,程序员就要失业了
Agent确实能干很多活,但它需要Harness Engineering来约束和管理。谁来设计Harness?谁来定义Skill?谁来评估Agent的输出质量?还是程序员。工具变了,但工程思维永远不过时。
总结
回看这些AI技术名词,你会发现它们其实都在解决同一件事:怎么让AI从"回答一句话",慢慢变成真正能协助人完成工作的系统。
最开始,AI只是"能聊天"(LLM + Prompt)。后来,它开始理解复杂指令、记住上下文、生成文字图片视频(Context + Memory + AIGC)。再后来,它会查资料、调用工具、执行复杂任务(RAG + MCP + Skill + Agent)。最后,我们用工程化的方法把它们管理起来(Harness Engineering)。
技术名词不可怕,可怕的是把它们当成孤立的孤岛。串成链、理清楚,你会发现AI的世界没那么复杂。
如果觉得这篇文章对你有帮助,欢迎点赞、在看、转发三连!有问题也可以在评论区留言,我会尽量回复。
关于作者:程序猿Joe,从CRUD程序员到架构师的蜕变者,专治各种"代码癌症"。不定期分享技术干货,欢迎关注。
更多推荐



所有评论(0)