前言

技术术语的更迭,不仅是语言表达的更替,更代表着思维范式的转变。从提示词、提示词工程到上下文工程,折射的是大模型应用技术的不断深化,反映了复杂性和工程化的演化以及应对策略的转变。

本文将介绍上下文工程的演变和 5 种上下文编排模式。

提示词,提示词工程,上下文工程

LLM 出现伊始,提示词(prompt)很自然成为需要掌握的新语言,如何正确向LLM提问,以获取想要的答案;随着各种 LLM 涌现,不同模型技术架构和数据不同,如何提炼抽象出稳定的技巧,以减小幻觉,稳定地获得想要地答案,提示词工程(prompt engineering)应运而生,它实际反映的是对自己问题的系统性思考和科学地表达,提示词工程巅峰的时候是传闻硅谷开出几万美金月薪招聘提示词工程师,到现在已经发展出了prompt as a artifact(提示词即交付),把提示词作为一个交付物,看一个李继刚的示例:

# Role:知识探索专家
## Profile:
- author: 李继刚
- version: 0.8
- language: 中文
- description: 我是一个专门用于提问并解答有关特定知识点的 AI 角色。
 ## Goals:
 提出并尝试解答有关用户指定知识点的三个关键问题:其来源、其本质、其发展。
 ## Constrains:
 1. 对于不在你知识库中的信息, 明确告知用户你不知道
 2. 你不擅长客套, 不会进行没有意义的夸奖和客气对话
 3. 解释完概念即结束对话, 不会询问是否有其它问题
 
## Skills:
 1. 具有强大的知识获取和整合能力
 2.  拥有广泛的知识库, 掌握提问和回答的技巧
 3.  拥有排版审美, 会利用序号, 缩进, 分隔线和换行符等等来美化信息排版
 4. 擅长使用比喻的方式来让用户理解知识
 5. 惜字如金, 不说废话

## Workflows:
 你会按下面的框架来扩展用户提供的概念, 并通过分隔符, 序号, 缩进, 换行符等进行排版美化
 1.它从哪里来?
 ━━━━━━━━━━━━━━━━━━
 - 讲解清楚该知识的起源, 它是为了解决什么问题而诞生。
 - 然后对比解释一下: 它出现之前是什么状态, 它出现之后又是什么状态?
 2.它是什么?
 ━━━━━━━━━━━━━━━━━━
 - 讲解清楚该知识本身,它是如何解决相关问题的?
 -  再说明一下: 应用该知识时最重要的三条原则是什么?
 -  接下来举一个现实案例方便用户直观理解:
 -  案例背景情况(遇到的问题)
 -  使用该知识如何解决的问题
 -  optional: 真实代码片断样例
 3.它到哪里去?
 ━━━━━━━━━━━━━━━━━━
 - 它的局限性是什么?
 -  当前行业对它的优化方向是什么?
 -  未来可能的发展方向是什么?
 # Initialization:
 作为知识探索专家,我拥有广泛的知识库和问题提问及回答的技巧,严格遵守尊重用户和提供准确信息的原则。我会使用默认的中文与您进行对话,首先我会友好地欢迎您,然后会向您介绍我自己以及我的工作流程。

Markdown 的格式很适合 LLM 理解,结构化的角色、目标、限制、以及思维链提示,大大提高了挖掘大模型能力的体验。

上下文工程(context engineering),我最初看到是 Andrej Karpathy (OpenAI 创始人之一) 的推文[1]:

Karpathy 认为其比 “提示词工程” 更贴切。在工业级大语言模型应用里,上下文工程兼具科学与艺术属性:科学体现在需精准把控任务描述、示例、数据等信息,平衡信息多寡与相关性以保障模型性能、控制成本;艺术则源于对 LLM 心理和人类直觉的理解。

可见,随着 AI 应用的深入,上下文工程的出现也是水到渠成,预示着在 AI 架构上思考方式的转变。

5 种上下文编排模式

上下文工程包括上下文从哪来?保留哪些?丢弃哪些?是否要压缩?如何压缩?是否需要隔离?谁来写?谁来拼接?所有这些问题构成了上下文工程的工作边界[2]。

尤其是 multi-agent 的发展,一个完整的 Agentic AI 应用往往涉及到 workflow 里多个模型的调用,这些模型很大程度上取决于上述问题的解决,我们来看看 5 种上下文编排模式(Context Orchestration)[3]:

上图模式1,是常用的多 agent 架构,分为三步:将其工作分解为多个部分、启动子代理(subagent)来处理这些部分、最终将这些结果结合起来。

然而,它非常不稳定,关键的失败点在于:没有共享的上下文,各自为政。比如,我需要建一个学校,子任务有建食堂和教学楼,但是都需要共同的规划,不然建一个容纳10人的食堂,但是准备了300人的叫教学楼,显而易见是不合理的。

上图模式2,吸取了模式1没有统一规划(共享的上下文)的缺点,请注意不同颜色的小方块,代表了共享的上下文和子代理(subagent)生成的上下文,最后的结果已经综合了共享上下文、subagent1、subagent2生成的结果,较好保持了方案的一致性。

但是(这里就有但是了),继续上面的例子,通过共同的上下文,得知了都需要建能容纳300人规模的教学楼和食堂,但是在修建的时候,各自胡乱堆砌建筑材料,导致空间不够用,施工进展也不一样,学校也不能很好修建。

这里的问题在于需要沟通的两个 agent 之间没有信息交互(相应的,也有应该是独立的两个 agent,这也是上下文工程的内容之一——agent 之间的交互和独立)。

上图模式3,请依然注意带颜色的小方块,这里最终结果既有共享的上下文,也有subtask1的上下文,以及共享+subtask1结合生成的subtask2的结果,应该能得到比较完美的结果。

但是(这里又有但是),不要忘记 LLM 是有上下文限制的,一旦subagent过多,不断堆积,很大可能超出上下文窗口,即使没有超出上下文窗口,过长的上下文也会影响 LLM 最终的推理和生成结果。

上图模式4,针对模式3,引入了上下文压缩(Context Compression),只保留关键的上下文信息和结果,这里需要继续攻克的点在于如何确保留下的是关键的,而且没有漏掉有用信息,即不重不漏。

上图模式5,在模式4的基础上加了并行的处理结构,以及左右列独立处理,另外 context 管理独立出来作为可交互的组件,这也许是下一个阶段agent 的进化方向。

神经网络的文艺复兴

行内人可能有点感觉,这不跟早期神经网络的结构一样一样的。放两张 Resnet 和 U-net 的结构图大家品味下,也许我们可以来一场神经网络的文艺复兴,从以前的经典结构里汲取灵感。

最后

为什么要学AI大模型

当下,⼈⼯智能市场迎来了爆发期,并逐渐进⼊以⼈⼯通⽤智能(AGI)为主导的新时代。企业纷纷官宣“ AI+ ”战略,为新兴技术⼈才创造丰富的就业机会,⼈才缺⼝将达 400 万!

DeepSeek问世以来,生成式AI和大模型技术爆发式增长,让很多岗位重新成了炙手可热的新星,岗位薪资远超很多后端岗位,在程序员中稳居前列。

在这里插入图片描述

与此同时AI与各行各业深度融合,飞速发展,成为炙手可热的新风口,企业非常需要了解AI、懂AI、会用AI的员工,纷纷开出高薪招聘AI大模型相关岗位。
在这里插入图片描述
最近很多程序员朋友都已经学习或者准备学习 AI 大模型,后台也经常会有小伙伴咨询学习路线和学习资料,我特别拜托北京清华大学学士和美国加州理工学院博士学位的鲁为民老师给大家这里给大家准备了一份涵盖了AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频 全系列的学习资料,这些学习资料不仅深入浅出,而且非常实用,让大家系统而高效地掌握AI大模型的各个知识点。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

AI大模型系统学习路线

在面对AI大模型开发领域的复杂与深入,精准学习显得尤为重要。一份系统的技术路线图,不仅能够帮助开发者清晰地了解从入门到精通所需掌握的知识点,还能提供一条高效、有序的学习路径。

img

但知道是一回事,做又是另一回事,初学者最常遇到的问题主要是理论知识缺乏、资源和工具的限制、模型理解和调试的复杂性,在这基础上,找到高质量的学习资源,不浪费时间、不走弯路,又是重中之重。

AI大模型入门到实战的视频教程+项目包

看视频学习是一种高效、直观、灵活且富有吸引力的学习方式,可以更直观地展示过程,能有效提升学习兴趣和理解力,是现在获取知识的重要途径

在这里插入图片描述
光学理论是没用的,要学会跟着一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。
在这里插入图片描述

海量AI大模型必读的经典书籍(PDF)

阅读AI大模型经典书籍可以帮助读者提高技术水平,开拓视野,掌握核心技术,提高解决问题的能力,同时也可以借鉴他人的经验。对于想要深入学习AI大模型开发的读者来说,阅读经典书籍是非常有必要的。
在这里插入图片描述

600+AI大模型报告(实时更新)

这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。
在这里插入图片描述

AI大模型面试真题+答案解析

我们学习AI大模型必然是想找到高薪的工作,下面这些面试题都是总结当前最新、最热、最高频的面试题,并且每道题都有详细的答案,面试前刷完这套面试题资料,小小offer,不在话下
在这里插入图片描述

在这里插入图片描述

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

Logo

更多推荐