超越RAG：上下文工程详解，程序员必备技能，值得反复收藏学习

文章介绍了上下文工程(Context Engineering)这一由Andrej Karpathy提出的新范式，它是设计和优化LLM输入信息的艺术与科学，旨在解决RAG方法中的检索不准确、LLM忽略信息、上下文过长等问题。上下文工程涵盖数据准备、检索优化和上下文构建三个层面，通过写入-筛选-压缩-隔离策略提高LLM回答的准确性和可靠性。未来，上下文工程将自动化并突破RAG限制，成为解锁大模型潜力的

大模型玩家

872人浏览 · 2025-09-25 11:40:39

大模型玩家 · 2025-09-25 11:40:39 发布

1、上下文工程解决什么问题

2、上下文工程所包含的范围

3、上下文工程落地的策略

4、上下文工程不等同于上下文

5、上下文工程前瞻思考

今年6月25日，AI大神Andrej Karpathy 在推特上火了一个词——上下文工程（Context Engineering）。这不仅是技术术语更替，更代表着思维范式的转变。

1、上下文工程解决什么问题

我之前有篇文章写GRPO时候提到，“2024年卷RAG，一周出Demo,优化用半年”，现在不是半年的问题，方向上，想提高生成式问答效果，如果还不跳出RAG的思维，那是很难有优化空间的。简单地“检索-拼接-生成”往往并不能得到最优结果。你可能会遇到：

检索到的信息不准确或与问题无关。
即使检索到了相关信息，LLM却忽略了它，依然依赖自身知识产生幻觉。
上下文太长，导致LLM无法关注到关键信息，或者因超过令牌限制而被截断。

上下文工程正是为了解决这些问题而存在的。 它是一门设计和优化输入给LLM的上下文信息的艺术与科学，旨在最大化LLM的推理能力和输出质量。

2、上下文工程所包含的范围

一句话，只要是模型生成回答之前所看到的一切信息，都是上下文工程的范畴。

在这里插入图片描述

其核心工作贯穿以下流程：

1. 检索前的数据准备（知识库层面）

分块（Chunking）

如何将长文档切割成更小的片段至关重要。块太大可能包含多主题干扰信息，太小则可能丢失关键上下文。工程师需要根据文档类型（如MD文档、PDF表格、代码）调整块大小和重叠（Overlap）策略。
数据清洗与增强

清除无关内容（页眉、页脚）、标准化格式、为文本添加元数据（如标题、发布日期、部门），这些元数据可以极大提升检索的精准度。
选择嵌入模型（Embedding Model）

不同的模型在不同领域和语言上表现各异。为特定领域微调嵌入模型或选择专有模型，可以显著提升检索相关性。

2. 检索中的优化（查询与搜索层面）

查询重写/扩展（Query Reformulation/Expansion）

用户的原始查询可能很模糊。使用LLM对查询进行重写、扩展同义词或生成假设性答案（HyDE），可以大幅提升检索效果。
检索策略

除了简单的相似性搜索，还可以融合关键词搜索（BM25）进行混合搜索（Hybrid Search），兼顾语义匹配和精确术语匹配。高级技术如重新排序（Re-ranking）模型，可以对初步检索结果进行二次精排，将最相关的结果排在前面。

3. 生成前的上下文构建（提示词层面）——这是上下文工程的核心

上下文压缩与摘要

检索到的多个文档片段可能包含冗余信息。可以使用LLM先对这些片段进行摘要或去重，只将最精炼的信息放入上下文，节省宝贵的令牌。
结构化与排序

将检索到的上下文以清晰、有条理的方式呈现给LLM。例如，按相关性排序，或使用明确的章节标题（如“## 相关文档1：… ## 相关文档2：…”），帮助LLM更好地理解和利用这些信息。
设计系统提示（System Prompt）

这是上下文工程的精髓。系统提示用于明确指导LLM如何利用上下文。

糟糕的提示

“请根据以下文档回答问题。”
工程化的提示

“你是一个专业的客服助手。请严格根据提供的参考文档来回答问题。如果文档中的信息不足以回答问题，请明确回答‘根据已有信息无法回答该问题’，切勿编造信息。你的回答需清晰引用文档来源。参考文档如下：…”

通过上述精细化的操作，上下文工程确保了注入LLM的信息是高相关、高质量、易理解的，从而最终引导LLM生成更准确、更可靠、更符合要求的答案。

3、上下文工程落地的策略

在这里插入图片描述

上面四个落地策略来自Langchain 发布的一篇博客文章，归纳四个词就是写入-筛选-压缩-隔离，有点像SQL的增-删-改-查。

本质上，我们现在的调优工作，其实都在上下文工程这个范畴，这里面涉及到的Scratchpads、Memories、Tools、Knowledge、Context Summarization、Multi-agent、Context等

再回归到问题的本质，如果只是需要提高大语言模型回答问题的准确率和质量，engineering这里面有非常大的想象空间，RAG只是一个context engineering非常粗糙的一个工程方案。

Andrej Karpathy一个推特火了一个新词，就能让这个工作成为业界一个追逐范式，并且发展成一个工程学科，这就是业界影响力！

4、上下文工程不等同于上下文

两者的目的都是通过引入额外的、动态的信息，使系统的输出与当前情境更相关、更精准。

在我们MCP应用中，目前我们一个稍微复杂点的问题，MCP最多能调12-15个Tools, 但实际调用3个Tools就能解决这个问题。一些技术报告也实验证明了更多的工具、更多的补充信息、更长的上下文并不一定会产生更好的响应。上下文过载可能会导致智能体以意想不到的方式失败。上下文可能会变得有害、分散注意力、令人困惑或产生冲突。

在我们A2A应用中，智能体之前也是依赖上下文来收集信息，但综合发现一旦涉及到多轮对话上下文，动作智能体之间的关系就容易出错，因为一旦涉及到相互协作和相互依赖，信息之间就会出现错乱。

我个人理解，在比较高级一点的应用，这两项技术应该是相互融合的，一方面要让生成的回答更准确、可信、相关；另一方面，追求个性化、情境化的智能输出。

5、上下文工程前瞻思考

如题，Context Engineering是解锁大模型真正潜力的关键，未来落地落地思考会暂时会围绕以下两点去展开：

1）大语言模型（LLM）作为智能体的大脑，那上下文工程就是这个大脑的”外脑“，它未来要自主决定何时需要检索、检索什么、如何根据初步结果进行下一步操作，这一定是自动化的。

2）突破RAG系统限制，追求对上下文的深度加工**，而RAG只提供了“检索”这一种获取方式。加工包括：总结、翻译、格式化、过滤、排序、压缩等，远非简单的“检索并拼接”。**

最后，回想在深度学习时代，一直在调侃自己是“调参侠”，至从研究人员把离散的网络结构搜索变成连续可微的优化问题，一次训练即可评估数千种结构，从此“调网络结构”不再需要人手动试。后续 ENAS、FBNet、ProxylessNAS 等把显存和搜索时间降到单卡几小时，彻底工程化，模型输出直接可获得部署的模型（模型结构 +网络权重 +超参数），这样AI工程师人员彻底不用关心模型训练过程。

如今在大模型时代，提示工程（Prompt Engineering）已然不能完全解放人工写提示过程，但上下文工程（Context Engineering）是有可能彻底告别人工调优的。

普通人如何抓住AI大模型的风口？

领取方式在文末

为什么要学习大模型？

目前AI大模型的技术岗位与能力培养随着人工智能技术的迅速发展和应用，大模型作为其中的重要组成部分，正逐渐成为推动人工智能发展的重要引擎。大模型以其强大的数据处理和模式识别能力，广泛应用于自然语言处理、计算机视觉、智能推荐等领域，为各行各业带来了革命性的改变和机遇。

目前，开源人工智能大模型已应用于医疗、政务、法律、汽车、娱乐、金融、互联网、教育、制造业、企业服务等多个场景，其中，应用于金融、企业服务、制造业和法律领域的大模型在本次调研中占比超过 30%。
在这里插入图片描述

随着AI大模型技术的迅速发展，相关岗位的需求也日益增加。大模型产业链催生了一批高薪新职业：
在这里插入图片描述

人工智能大潮已来，不加入就可能被淘汰。如果你是技术人，尤其是互联网从业者，现在就开始学习AI大模型技术，真的是给你的人生一个重要建议！

最后

只要你真心想学习AI大模型技术，这份精心整理的学习资料我愿意无偿分享给你，但是想学技术去乱搞的人别来找我！

在当前这个人工智能高速发展的时代，AI大模型正在深刻改变各行各业。我国对高水平AI人才的需求也日益增长，真正懂技术、能落地的人才依旧紧缺。我也希望通过这份资料，能够帮助更多有志于AI领域的朋友入门并深入学习。

真诚无偿分享！！！
vx扫描下方二维码即可
加上后会一个个给大家发
在这里插入图片描述

大模型全套学习资料展示

自我们与MoPaaS魔泊云合作以来，我们不断打磨课程体系与技术内容，在细节上精益求精，同时在技术层面也新增了许多前沿且实用的内容，力求为大家带来更系统、更实战、更落地的大模型学习体验。

希望这份系统、实用的大模型学习路径，能够帮助你从零入门，进阶到实战，真正掌握AI时代的核心技能！

01 教学内容

从零到精通完整闭环：【基础理论 →RAG开发 → Agent设计 → 模型微调与私有化部署调→热门技术】5大模块，内容比传统教材更贴近企业实战！
大量真实项目案例： 带你亲自上手搞数据清洗、模型调优这些硬核操作，把课本知识变成真本事‌！

02适学人群

应届毕业生‌： 无工作经验但想要系统学习AI大模型技术，期待通过实战项目掌握核心技术。

零基础转型‌： 非技术背景但关注AI应用场景，计划通过低代码工具实现“AI+行业”跨界‌。

业务赋能突破瓶颈： 传统开发者（Java/前端等）学习Transformer架构与LangChain框架，向AI全栈工程师转型‌。

vx扫描下方二维码即可
在这里插入图片描述

本教程比较珍贵，仅限大家自行学习，不要传播！更严禁商用！

03 入门到进阶学习路线图

大模型学习路线图，整体分为5个大的阶段：

04 视频和书籍PDF合集

从0到掌握主流大模型技术视频教程（涵盖模型训练、微调、RAG、LangChain、Agent开发等实战方向）

新手必备的大模型学习PDF书单来了！全是硬核知识，帮你少走弯路（不吹牛，真有用）

05 行业报告+白皮书合集

收集70+报告与白皮书，了解行业最新动态！

06 90+份面试题/经验

AI大模型岗位面试经验总结（谁学技术不是为了赚$呢，找个好的岗位很重要）
在这里插入图片描述

07 deepseek部署包+技巧大全

在这里插入图片描述

由于篇幅有限

只展示部分资料

并且还在持续更新中…

真诚无偿分享！！！
vx扫描下方二维码即可
加上后会一个个给大家发
在这里插入图片描述

北京朝阳AI社区

更多推荐

2026届必备的五大降AI率方案推荐

北京朝阳AI社区

2025届最火的十大降AI率方案解析与推荐

北京朝阳AI社区

【大模型微调】一文了解对齐微调RLHF、PPO、DPO、IPO（通俗易懂，新手可食）

特性RLHF (PPO)DPOIPO比喻老师打分，学生改卷拿着好坏试卷对比学习对比学习，但防止走极端复杂度极高(需维护4个模型副本)低(只需维护2个模型)低(同 DPO)训练稳定性差 (容易训练失败)好 (主要调参即可)更好 (理论上更收敛)需要奖励模型?需要不需要不需要当前地位经典主流首选DPO 的强力替代方案。