AI Agent上下文工程的艺术:从越智能死越快到做减法的智慧!
文章探讨了AI Agent中的上下文膨胀问题,指出Agent因过度调用工具导致上下文滚雪球式增长,引发性能下降。提出了五大解决方案:Offload、Reduce、Retrieve、Isolate、Cache。强调压缩与总结的本质区别,提倡通过分层架构和功能简化(仅保留三个Agent类型)实现高效设计,主张"做减法"而非堆砌功能,避免上下文过度工程化,让模型工作更简单而非更复杂。
最近,Langchain 的工程师 Lance Martin 和 Manus 的创始人Peak 季逸超 进行了一次关于Agent的研讨会,信息量有点大,整理了一些结论分享一下。

一个现实:Agent越智能,死得越快。
问题出在哪?
Agent会疯狂调用工具,每次调用都会把结果塞进上下文里。
Manus提到他们一些任务需要50次工具调用,Anthropic说生产环境的Agent对话能跑几百轮。
结果就是,上下文像滚雪球一样越滚越大,最后开始出现 Context Rot,模型重复输出、推理变慢、质量下降。
这就是个悖论:Agent需要大量上下文才能工作,但上下文越多性能越差。
现在的解决方案基本就五招:
Offload、Reduce、Retrieve、Isolate、Cache。
分别对应了,文件系统、总结/压缩、语义召回、Sub-Agent、缓存。
因为大家太熟概念了,就不展开这几点了。
Peak分享了个很有意思的点:Compaction(压缩)≠ Summarization(总结)。
压缩是可逆的,比如写文件操作,完整版有path和content两个字段,压缩后只保留path,因为内容已经写进文件系统了,需要的时候再读回来。总结是不可逆的,信息会永久丢失。

所以Manus的策略是:先压缩,压不动了再总结。而且总结的时候必须用完整数据,不能用压缩版,否则信息损失会叠加。

一个趋势是,Agent 用一组较少的通用工具,这些工具使Agent能够访问计算机。
比如说,用 Bash 工具和几个访问文件系统的工具,就可以执行各种任务了。
所以Manus做了一个分层架构,外层只有不到20个原子能力。
将大多数的操作卸载到sandbox层。可以命令行调用,MCP通过CLI接入,可以写python脚本调用第三方API。

Manus最大的进步不是加功能,而是删功能。
过去七个月,每次简化架构,系统就变得更快、更稳、更聪明。
因为Context Engineering的目标不是让模型更复杂,而是让模型的工作更简单。
小心Context Over-Engineering(上下文过度工程化)。
Agent的上下文工程不是堆砌技巧,而是做减法的艺术。
Manus不做多角色Agent(什么设计师Agent、程序员Agent),因为那是人类公司的组织架构,是人类上下文能力的局限导致的。
AI为什么要模仿人类的限制?
他们只有三个Agent:通用执行Agent、规划Agent、知识管理Agent。就这么简单。
所以说,别再让Agent被自己的上下文撑死了。做减法,trust the model a little more。

0基础怎么学习AI大模型?
我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。
我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。
这份完整版的大模型 AI 学习和面试资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

第一阶段: 从大模型系统设计入手,讲解大模型的主要方法;
第二阶段: 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;
第三阶段: 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;
第四阶段: 大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;
第五阶段: 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;
第六阶段: 以SD多模态大模型为主,搭建了文生图小程序案例;
第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。

👉学会后的收获:👈
• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;
• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;
• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;
• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。

1.AI大模型学习路线图
2.100套AI大模型商业化落地方案
3.100集大模型视频教程
4.200本大模型PDF书籍
5.LLM面试题合集
6.AI产品经理资源合集
👉获取方式:
😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

更多推荐

所有评论(0)