超越RAG:上下文工程详解,程序员必备技能,值得反复收藏学习
文章介绍了上下文工程(Context Engineering)这一由Andrej Karpathy提出的新范式,它是设计和优化LLM输入信息的艺术与科学,旨在解决RAG方法中的检索不准确、LLM忽略信息、上下文过长等问题。上下文工程涵盖数据准备、检索优化和上下文构建三个层面,通过写入-筛选-压缩-隔离策略提高LLM回答的准确性和可靠性。未来,上下文工程将自动化并突破RAG限制,成为解锁大模型潜力的
目录:
1、上下文工程解决什么问题
2、上下文工程所包含的范围
3、上下文工程落地的策略
4、上下文工程不等同于上下文
5、上下文工程前瞻思考
今年6月25日,AI大神Andrej Karpathy 在推特上火了一个词——上下文工程(Context Engineering)。这不仅是技术术语更替,更代表着思维范式的转变。
1、上下文工程解决什么问题
我之前有篇文章写GRPO时候提到,“2024年卷RAG,一周出Demo,优化用半年”,现在不是半年的问题,方向上,想提高生成式问答效果,如果还不跳出RAG的思维,那是很难有优化空间的。简单地“检索-拼接-生成”往往并不能得到最优结果。你可能会遇到:
- 检索到的信息不准确或与问题无关。
- 即使检索到了相关信息,LLM却忽略了它,依然依赖自身知识产生幻觉。
- 上下文太长,导致LLM无法关注到关键信息,或者因超过令牌限制而被截断。
上下文工程正是为了解决这些问题而存在的。 它是一门设计和优化输入给LLM的上下文信息的艺术与科学,旨在最大化LLM的推理能力和输出质量。
2、上下文工程所包含的范围
一句话,只要是模型生成回答之前所看到的一切信息,都是上下文工程的范畴。

其核心工作贯穿以下流程:
1. 检索前的数据准备(知识库层面)
-
分块(Chunking)
如何将长文档切割成更小的片段至关重要。块太大可能包含多主题干扰信息,太小则可能丢失关键上下文。工程师需要根据文档类型(如MD文档、PDF表格、代码)调整块大小和重叠(Overlap)策略。
-
数据清洗与增强
清除无关内容(页眉、页脚)、标准化格式、为文本添加元数据(如标题、发布日期、部门),这些元数据可以极大提升检索的精准度。
-
选择嵌入模型(Embedding Model)
不同的模型在不同领域和语言上表现各异。为特定领域微调嵌入模型或选择专有模型,可以显著提升检索相关性。
2. 检索中的优化(查询与搜索层面)
-
查询重写/扩展(Query Reformulation/Expansion)
用户的原始查询可能很模糊。使用LLM对查询进行重写、扩展同义词或生成假设性答案(HyDE),可以大幅提升检索效果。
-
检索策略
除了简单的相似性搜索,还可以融合关键词搜索(BM25)进行混合搜索(Hybrid Search),兼顾语义匹配和精确术语匹配。高级技术如重新排序(Re-ranking)模型,可以对初步检索结果进行二次精排,将最相关的结果排在前面。
3. 生成前的上下文构建(提示词层面)——这是上下文工程的核心
-
上下文压缩与摘要
检索到的多个文档片段可能包含冗余信息。可以使用LLM先对这些片段进行摘要或去重,只将最精炼的信息放入上下文,节省宝贵的令牌。
-
结构化与排序
将检索到的上下文以清晰、有条理的方式呈现给LLM。例如,按相关性排序,或使用明确的章节标题(如“## 相关文档1:… ## 相关文档2:…”),帮助LLM更好地理解和利用这些信息。
-
设计系统提示(System Prompt)
这是上下文工程的精髓。系统提示用于明确指导LLM如何利用上下文。
-
糟糕的提示
“请根据以下文档回答问题。”
-
工程化的提示
“你是一个专业的客服助手。请严格根据提供的参考文档来回答问题。如果文档中的信息不足以回答问题,请明确回答‘根据已有信息无法回答该问题’,切勿编造信息。你的回答需清晰引用文档来源。参考文档如下:…”
通过上述精细化的操作,上下文工程确保了注入LLM的信息是高相关、高质量、易理解的,从而最终引导LLM生成更准确、更可靠、更符合要求的答案。
3、上下文工程落地的策略

上面四个落地策略来自Langchain 发布的一篇博客文章,归纳四个词就是写入-筛选-压缩-隔离,有点像SQL的增-删-改-查。
本质上,我们现在的调优工作,其实都在上下文工程这个范畴,这里面涉及到的Scratchpads、Memories、Tools、Knowledge、Context Summarization、Multi-agent、Context等
再回归到问题的本质,如果只是需要提高大语言模型回答问题的准确率和质量,engineering这里面有非常大的想象空间,RAG只是一个context engineering非常粗糙的一个工程方案。
Andrej Karpathy一个推特火了一个新词,就能让这个工作成为业界一个追逐范式,并且发展成一个工程学科,这就是业界影响力!
4、上下文工程不等同于上下文
两者的目的都是通过引入额外的、动态的信息,使系统的输出与当前情境更相关、更精准。
在我们MCP应用中,目前我们一个稍微复杂点的问题,MCP最多能调12-15个Tools, 但实际调用3个Tools就能解决这个问题。一些技术报告也实验证明了更多的工具、 更多的补充信息、更长的上下文并不一定会产生更好的响应。上下文过载可能会导致智能体以意想不到的方式失败。上下文可能会变得有害、分散注意力、令人困惑或产生冲突。
在我们A2A应用中,智能体之前也是依赖上下文来收集信息,但综合发现一旦涉及到多轮对话上下文,动作智能体之间的关系就容易出错,因为一旦涉及到相互协作和相互依赖,信息之间就会出现错乱。
我个人理解,在比较高级一点的应用,这两项技术应该是相互融合的,一方面要让生成的回答更准确、可信、相关;另一方面,追求个性化、情境化的智能输出。
5、上下文工程前瞻思考
如题,Context Engineering是解锁大模型真正潜力的关键,未来落地落地思考会暂时会围绕以下两点去展开:
1) 大语言模型(LLM)作为智能体的大脑,那上下文工程就是这个大脑的”外脑“,它未来要自主决定何时需要检索、检索什么、如何根据初步结果进行下一步操作,这一定是自动化的。
2)突破RAG系统限制,追求对上下文的深度加工**,而RAG只提供了“检索”这一种获取方式。加工包括:总结、翻译、格式化、过滤、排序、压缩等,远非简单的“检索并拼接”。**
最后,回想在深度学习时代,一直在调侃自己是“调参侠”,至从研究人员把离散的网络结构搜索变成连续可微的优化问题,一次训练即可评估数千种结构,从此“调网络结构”不再需要人手动试。后续 ENAS、FBNet、ProxylessNAS 等把显存和搜索时间降到单卡几小时,彻底工程化,模型输出直接可获得部署的模型(模型结构 +网络权重 +超参数),这样AI工程师人员彻底不用关心模型训练过程。
如今在大模型时代,提示工程(Prompt Engineering)已然不能完全解放人工写提示过程,但上下文工程(Context Engineering)是有可能彻底告别人工调优的。
普通人如何抓住AI大模型的风口?
领取方式在文末
为什么要学习大模型?
目前AI大模型的技术岗位与能力培养随着人工智能技术的迅速发展和应用 , 大模型作为其中的重要组成部分 , 正逐渐成为推动人工智能发展的重要引擎 。大模型以其强大的数据处理和模式识别能力, 广泛应用于自然语言处理 、计算机视觉 、 智能推荐等领域 ,为各行各业带来了革命性的改变和机遇 。
目前,开源人工智能大模型已应用于医疗、政务、法律、汽车、娱乐、金融、互联网、教育、制造业、企业服务等多个场景,其中,应用于金融、企业服务、制造业和法律领域的大模型在本次调研中占比超过 30%。
随着AI大模型技术的迅速发展,相关岗位的需求也日益增加。大模型产业链催生了一批高薪新职业:
人工智能大潮已来,不加入就可能被淘汰。如果你是技术人,尤其是互联网从业者,现在就开始学习AI大模型技术,真的是给你的人生一个重要建议!
最后
只要你真心想学习AI大模型技术,这份精心整理的学习资料我愿意无偿分享给你,但是想学技术去乱搞的人别来找我!
在当前这个人工智能高速发展的时代,AI大模型正在深刻改变各行各业。我国对高水平AI人才的需求也日益增长,真正懂技术、能落地的人才依旧紧缺。我也希望通过这份资料,能够帮助更多有志于AI领域的朋友入门并深入学习。
真诚无偿分享!!!
vx扫描下方二维码即可
加上后会一个个给大家发
大模型全套学习资料展示
自我们与MoPaaS魔泊云合作以来,我们不断打磨课程体系与技术内容,在细节上精益求精,同时在技术层面也新增了许多前沿且实用的内容,力求为大家带来更系统、更实战、更落地的大模型学习体验。

希望这份系统、实用的大模型学习路径,能够帮助你从零入门,进阶到实战,真正掌握AI时代的核心技能!
01 教学内容

-
从零到精通完整闭环:【基础理论 →RAG开发 → Agent设计 → 模型微调与私有化部署调→热门技术】5大模块,内容比传统教材更贴近企业实战!
-
大量真实项目案例: 带你亲自上手搞数据清洗、模型调优这些硬核操作,把课本知识变成真本事!
02适学人群
应届毕业生: 无工作经验但想要系统学习AI大模型技术,期待通过实战项目掌握核心技术。
零基础转型: 非技术背景但关注AI应用场景,计划通过低代码工具实现“AI+行业”跨界。
业务赋能突破瓶颈: 传统开发者(Java/前端等)学习Transformer架构与LangChain框架,向AI全栈工程师转型。

vx扫描下方二维码即可
本教程比较珍贵,仅限大家自行学习,不要传播!更严禁商用!
03 入门到进阶学习路线图
大模型学习路线图,整体分为5个大的阶段:
04 视频和书籍PDF合集

从0到掌握主流大模型技术视频教程(涵盖模型训练、微调、RAG、LangChain、Agent开发等实战方向)

新手必备的大模型学习PDF书单来了!全是硬核知识,帮你少走弯路(不吹牛,真有用)
05 行业报告+白皮书合集
收集70+报告与白皮书,了解行业最新动态!
06 90+份面试题/经验
AI大模型岗位面试经验总结(谁学技术不是为了赚$呢,找个好的岗位很重要)

07 deepseek部署包+技巧大全

由于篇幅有限
只展示部分资料
并且还在持续更新中…
真诚无偿分享!!!
vx扫描下方二维码即可
加上后会一个个给大家发
更多推荐


所有评论(0)