收藏！小白程序员轻松入门大模型：AI水文？不，是上下文优化！

热爱python的小谢

361人浏览 · 2026-03-06 10:18:03

热爱python的小谢 · 2026-03-06 10:18:03 发布

本文深入浅出地讲解了如何优化大模型（如 Claude Code）的上下文输入，以提升模型输出质量。核心在于，用户需理解上下文的重要性，并遵循80/20法则，通过升级、选择合适的模型和创建项目初始化文件等基础步骤提升效率。此外，文章还介绍了如何通过目标导向的对话管理、适时重置和避免复杂度陷阱来优化上下文。最后，提出了使用MCP servers、subagents和skills等高级功能来获取高质量上下文的方法，旨在帮助读者以简洁高效的方式引导大模型，避免陷入“水文陷阱”。

什么是上下文（context）？

上下文是指你向模型发送消息时提供的所有内容。
它包括提示词本身，以及所有环境信息：系统提示、元数据、您之前的消息、模型的思考、工具调用和响应——所有的一切。
模型的上下文窗口有限——因为随着对话规模的增大，它会越来越难以准确地跟踪对话中的内容。

在这里插入图片描述

上下文决定一切：当你让一个大语言模型（LLM）生成回答时，它能做什么、怎么回答，很大程度上取决于你提供的上下文信息
在 Claude Code 中，我们的上下文窗口只有 20 万个 token——这听起来很多，但实际上很快就会被填满。如果我们运行 /context 命令，就能明白原因了：
在这里插入图片描述

其中 22.5% 被预留，10.2% 被系统提示占用。扣除 MCP、子代理和规则等消耗后，空间就所剩无几了。
我们实际上只有 12 万个 token 可以使用——不仅如此，无论我们是否接近窗口限制，模型的性能质量都会随着上下文的增加而下降。因此，考虑到这一点，我们应该在上下文中放入什么内容，才能将其归类为“最优 token 集”，以最大化模型的输出？

大部分内容并不复杂。

和大多数事情一样，80/20 法则也适用于 Vibe 编程。也就是说，如果你已经安装了 Claude Code，并完成了以下基本步骤，那么你已经完成了 80% 的工作：

1. /upgrade -> 买最高级别套餐（是的，你需要它）
1. /model -> 用 Opus 4.5
1. /init -> 创建一个文件帮助 Claude 理解你的项目设置

从这里开始，你大概率已经听过的那些通用建议基本都是对的：

• 进入计划模式，按两次（Shift + Tab）
• 让 Claude 通过提问来澄清计划中的模糊点
• 执行你创建并不断精炼的计划
创建子代理、自定义命令、 Hooks、多代理编排很有趣，但……其实远没有我们想象的那么重要。
真正重要的是：把基础用好。

该如何使用这个工作流？

把每次新对话当成一个“目标（objective）”，并保持在这个目标的范围内。例如每个新线程都要有一个明确目标：

• 我想修复我遇到的这个bug
• 我想实现 app 的这个功能
如果是新项目，你的目标更宽泛也没问题——但这需要更多规划与反复精炼，因为目标越宽，就越容易因模糊而被误解。规划要更久，然后再更久地精炼规划——让 Claude 一直问问题，直到它已经开始“为了问而问”为止。让它多次审查你的计划：问架构、最佳实践、安全风险、生产可用性、测试策略——目标是把所有模糊点尽可能变成明确细节。

什么时候该重置（以及怎么做）

一般来说：如果进展良好，并且你继续要做的任务与当前上下文里的内容相似或相关——那就继续用同一个线程。
如果接近上下文窗口上限，运行 /compact 来腾空间——或者让 Claude Code 自动做（这就是 22.5% 缓冲区存在的意义）。

但如果情况“不顺利”呢？模型没按你想要的做，你陷入这种循环：
“这太烂了，请修” → 水文
“哥这更烂了，你在想啥？” → 水文
在这里插入图片描述

如果你到了这一步：直接回滚或重开。
发生这种情况，你有几个选择。你不该做的是：继续在同一个线程里强行挽回——不值得。相反：

• /rewind → 回到对话里进展还不错的某个点。
• /new → 直接开一个新线程。把原始提示词精炼一下再试一次。在新提示里明确写出“不要做什么”，也就是把之前出错的点直接写成警告。

要避免的复杂度陷阱

如果你在 𝕏（推特），你大概率已经被各种酷炫配置淹没了：MCP servers、subagents、skills……你可能还收藏了很多“以后要看”的东西。
我们之后会聊这些，但我第一条建议是：别过度乐观地把系统复杂化——正如 Anthropic 所说，我们的目标是“找到尽可能小、但信号密度极高的一组 tokens”。
你把 MCP server 的数据一股脑灌进去，往往是在用低信号内容填满上下文窗口——同时还在烧钱。
所以我们来讲讲：如何用 Claude Code 和其他 AI 工具的复杂功能，做更有效的上下文策略。

用 MCP servers 获取高质量上下文

MCP servers 基本上是第三方工具，LLM 可以用它们来获取有用上下文——比如文档、GitHub 代码、Linear 工单、Figma 设计等。
它们刚出来时 hype 很大，但大家很快发现：很多 MCP 非常吃上下文，常常不值得。
我个人目前在跑三个，对我很有用：

• exa[.]ai → 给 AI agents 用的网页搜索
• context7 → 给 AI agents 用的最新文档
• grep[.]app → 给 AI agents 用的 GitHub 搜索
我主要用 MCP 来收集“如何正确实现代码”的上下文——本质上就是我自己也能做的：查文档、找相关代码片段。
但事实证明，Anthropic 给这种方式起了个名字：“Just-in-time（即时）上下文策略”——让 agent 在需要时自己用工具去找信息，对 Claude Code 这类代理式编码工具非常有效。
不过这仍然会吃上下文；所以我们接着讲：如何用 subagents 更高效——这是我最喜欢的一个冷门技巧。

用 subagents 节省上下文

Claude Code 可以创建 subagents（主代理的子实例）。你可以用 /agents 查看当前配置了哪些子代理。
子代理和主代理一样，有系统提示：何时触发、如何行为、能调用哪些工具（包括 MCP 工具）。
关键在于，subagents：

• 有自己独立的上下文窗口（不污染主代理）
• 可以使用与主代理不同的模型（例如主代理用 opus，子代理用非 opus）
这意味着：我们可以把“吃 token 的任务”（比如研究）交给子代理去做，然后只把精炼摘要返回给主代理——主代理消耗很少 token，却得到高密度信息。

在这里插入图片描述

我最喜欢的一个工作流：创建一个自定义 “librarian（图书管理员）” 子代理，让它用 Sonnet（而不是 Opus）去扫描开源仓库和文档，再把浓缩总结返回给主代理。
我会让主代理这样做：
“用 librarian 研究如何用 y 库做 x，然后实现 z” → 子代理会触发，用它能用的所有工具找高质量、准确答案。
这个策略能避免污染主上下文窗口，并且通过用更便宜的模型处理更简单任务来省钱。

用 skills 拉取相关上下文

skills 有点像 subagents 的反面：不是把任务委派到一个独立上下文的专门代理，而是把专门技能“拉进当前代理的上下文窗口”。
例如 Claude Code 有一个 “frontend designer” skill，可以把一段很长的提示词拉进上下文，里面包含前端设计的 dos & don’ts。
在这里插入图片描述

这些流程听起来很花哨，但其实不复杂：Claude 只是判断应该用某个 skill，于是把那段文本加载进上下文而已。

总结

好的 vibe coding，本质是优化“高价值密度”的上下文。你添加或从 LLM 获得的任何信息，都应该以简洁方式帮助 LLM 更好地回答你下一步请求。

如果它没有做到这一点——就不要继续在同一个上下文里硬撑；这是避免陷入令人沮丧的“水文陷阱”的关键。
你在推特上看到的那些花哨命令——subagents、mcp、skills 等——可能让你觉得自己落后了……
但现实是：没那么复杂。尽量用简洁、高质量的信息帮助模型，并给它在需要时自行检索相关信息的工具；就像你对待一个同事一样。

如何学习大模型 AI ？

由于新岗位的生产效率，要优于被取代岗位的生产效率，所以实际上整个社会的生产效率是提升的。

但是具体到个人，只能说是：

“最先掌握AI的人，将会比较晚掌握AI的人有竞争优势”。

这句话，放在计算机、互联网、移动互联网的开局时期，都是一样的道理。

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

这份完整版的大模型 AI 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】