引领行业！提示工程架构师在创新实验室的壮举

提示工程架构师的解决方案是用“分块+向量数据库+关联提示”解决长文本问题，让大模型从“读文献”变成“挖知识”。核心目标：为每个块生成“结构化摘要”，提取“核心知识点”（比如“靶点名称”“实验方法”“结论”）。Prompt设计以下是文献的一个块：“我们通过Western blot实验检测了疾病B患者的组织样本，发现靶点A的表达水平比健康对照组高3倍（p<0.01）。进一步的免疫组化实验显示，靶点A主

后端开发笔记

471人浏览 · 2025-09-11 19:22:13

后端开发笔记 · 2025-09-11 19:22:13 发布

从Prompt到生产力：提示工程架构师如何在创新实验室重构AI应用边界

一、引言：当大模型遇到“落地墙”，谁来当“翻译官”？

凌晨3点，某零售企业的客服总监摔了鼠标——刚上线的AI客服又“翻车”了：用户问“我买的羽绒服钻毛怎么办”，AI回复“亲，我们的羽绒服采用90%白鸭绒，保暖性好哦～”；用户追问“我是说钻毛！”，AI重复“亲，白鸭绒的优点是轻盈亲肤呢～”。

这不是个例。2023年以来，超80%的企业尝试过大模型应用，但只有15%能实现持续复用（来源：麦肯锡《大模型落地现状报告》）。问题出在哪儿？不是大模型不够聪明，而是没人把“业务需求”翻译成“大模型能听懂的语言”。

就像你对着一个只会说英语的厨师喊“我要吃辣的”，他可能给你端来加了黑胡椒的牛排——不是他不会做，是他没听懂“辣”在中餐里的具体含义。而提示工程架构师（Prompt Engineering Architect），就是这个“翻译官”：他们既能听懂业务端的“方言”（比如“提升客服满意度”“提高营销转化率”），也能说大模型的“母语”（比如分层提示、上下文记忆、多轮对话逻辑），更能设计一套“翻译系统”，让大模型从“实验室玩具”变成“企业生产力工具”。

在我所在的AI创新实验室，过去18个月里，提示工程架构师们用这样的“翻译系统”解决了12个行业痛点，让大模型的落地成功率从15%提升到了72%。这篇文章，我会带你走进实验室的真实项目，拆解提示工程架构师的“核心魔法”——不是写几个Prompt，而是设计一套能适配业务流程的“提示操作系统”。

二、先搞懂：提示工程架构师≠普通提示工程师

在聊具体项目前，必须先明确一个认知：提示工程架构师是“系统设计者”，而不是“Prompt写手”。两者的区别，就像“建筑设计师”和“砌砖工人”——前者要考虑整栋楼的结构、承重、功能分区，后者负责把砖堆起来。

1. 核心能力差异：从“点”到“系统”

普通提示工程师的工作是：针对某个具体任务写Prompt（比如“写一篇关于口红的营销文案”），优化关键词（比如把“显白”改成“黄皮显白”）。
提示工程架构师的工作是：将业务流程拆解为可被大模型执行的“任务流”，并设计一套“提示系统”来串联这些任务。比如：

对于“智能客服”，要拆解为“意图识别→问题分类→解决方案匹配→情感安抚”四个环节；
为每个环节设计对应的Prompt模块（比如意图识别模块用“用户说XX，判断是A/B/C哪种意图”）；
设计模块之间的“数据流动规则”（比如意图识别的结果要传递给问题分类模块，作为上下文）；
加入“纠错机制”（比如如果用户纠正了意图，系统要更新上下文，重新触发后续模块）。

2. 必备知识栈：“三角型”能力模型

要成为提示工程架构师，你需要同时掌握三个领域的知识：

大模型原理：懂Transformer的上下文窗口限制、注意力机制、不同模型的“性格”（比如GPT-4更擅长逻辑，Claude 3更擅长长文本，Gemini更擅长多模态）；
业务流程：能画出某行业的“价值流地图”（比如客服的“接待-解决-跟进”流程、营销的“用户画像-触达-转化”流程）；
用户心理学：能透过用户的“表面问题”看到“真实需求”（比如用户说“快递丢了”，真实需求是“快速拿到理赔”；用户说“口红沾杯”，真实需求是“约会时不用补妆”）。

3. 工具包：不是只有ChatGPT

提示工程架构师的“武器库”远不止大模型本身，还包括：

上下文管理工具：向量数据库（Pinecone、Chroma）——解决大模型“记不住长文本”的问题；
对话管理框架：LangChain、Rasa——实现多轮对话的“记忆”和“逻辑跳转”；
A/B测试工具：Optimizely、VWO——量化不同Prompt系统的效果；
结构化输出工具：JSON Schema、Pydantic——让大模型输出可直接导入数据库的结构化数据。

三、实验室实战：三个项目拆解提示工程架构的“底层逻辑”

接下来，我会用创新实验室的三个真实项目，带你看提示工程架构师是如何“翻译”业务需求，并用“提示系统”解决问题的。每个项目都会包含业务痛点→架构设计→效果数据→经验教训四个部分。

项目1：智能客服——从“机械回复”到“共情解决”

业务痛点：用户骂，客服累，满意度只有35%

某家居企业的客服团队有100人，每天处理2000+咨询，但用户满意度只有35%，核心问题是：

AI客服“答非所问”：用户问“沙发掉皮怎么办”，AI回复“我们的沙发采用真皮材质，耐用性强”；
人工客服“重复劳动”：每天有60%的问题是“物流查询”“退换货流程”，但AI解决不了，只能转人工；
情感安抚“模板化”：AI只会说“抱歉给您带来不便”，用户觉得“没温度”。

提示系统设计：“四层金字塔”架构

提示工程架构师的解决方案是设计一套**“意图-分类-解决-共情”四层提示系统**，用“分层处理”替代“一次性回答”。具体逻辑如下：

第一层：意图识别——听懂“话外之音”

核心目标：从用户的“模糊表述”中提取“真实意图”。
Prompt设计（以“沙发掉皮”为例）：

用户现在说：“我买的沙发才用了3个月，皮就掉了一块！”  
请你完成以下任务：  
1. 提取用户的核心诉求（比如“退换货”“维修”“赔偿”）；  
2. 判断用户的情绪（比如“愤怒”“焦虑”“失望”）；  
3. 输出格式：{"intent": "维修", "emotion": "愤怒"}

关键技巧：用“结构化输出”强制大模型聚焦核心信息，避免“发散”。

第二层：问题分类——匹配业务规则

核心目标：根据意图，匹配企业的“业务处理流程”（比如“维修”需要先确认“是否在质保期内”）。
Prompt设计：

已知用户意图是“维修”，情绪是“愤怒”，用户订单信息：  
- 购买时间：2023-10-15（质保期1年）；  
- 商品：真皮沙发（型号S-2023）；  
请你完成以下任务：  
1. 判断是否符合维修条件（是/否）；  
2. 列出需要用户提供的信息（比如“掉皮部位的照片”“订单编号”）；  
3. 输出格式：{"eligible": "是", "required_info": ["掉皮部位照片", "订单编号"]}

关键技巧：将“业务规则”（质保期1年）作为“上下文”传入Prompt，让大模型“遵守规则”。

第三层：解决方案——生成“可执行回复”

核心目标：根据前两层的结果，生成“具体、可操作”的回复（不是“套话”）。
Prompt设计：

已知：  
- 用户意图：维修；  
- 情绪：愤怒；  
- 符合维修条件；  
- 需要用户提供：掉皮部位照片、订单编号；  
请你生成回复，要求：  
1. 先共情（比如“我理解沙发掉皮会影响使用体验，换作是我也会很生气”）；  
2. 再讲解决方案（比如“您的沙发还在质保期内，我们会安排师傅上门维修”）；  
3. 最后要所需信息（比如“麻烦您提供掉皮部位的照片和订单编号，我马上为您登记”）；  
4. 语气要亲切，避免使用“抱歉给您带来不便”这类模板化表达。

关键技巧：用“步骤要求”强制大模型“先共情再解决”，避免“跳过情感直接讲流程”。

第四层：对话记忆——保持“上下文一致”

核心目标：让AI记住“之前的对话内容”，避免“重复问同样的问题”。
实现方式：用LangChain的“ConversationBufferMemory”工具，将每轮对话的关键信息（比如“用户已提供订单编号”）存储为“上下文变量”，传入下一轮Prompt。
示例：
用户第二轮说：“照片我发了，订单编号是123456”，Prompt会自动加入：

上下文：用户已提供订单编号123456和掉皮部位照片。

AI回复：“已收到您的信息，我会在1小时内安排维修师傅联系您，师傅的联系方式会通过短信发给您～”

效果：满意度从35%到82%，人工成本下降60%

用户满意度：从35%提升至82%（抽样1000条对话）；
人工转接率：从60%下降至18%（AI解决了82%的问题）；
处理效率：单条对话处理时间从2.5分钟缩短至45秒；
客服团队反馈：“以前每天要接100个重复电话，现在只用处理复杂问题，压力小多了。”

经验教训：别让AI“猜”，要让AI“执行规则”

错误尝试：一开始我们用“开放式Prompt”（比如“请你回复用户的问题”），结果AI经常“跑题”；
修正方向：用“结构化输出+业务规则上下文”，让AI“只能做指定的事”；
关键结论：大模型的“聪明”是优势，但在业务场景中，“听话”比“聪明”更重要。

项目2：个性化营销——从“通用文案”到“用户专属”

业务痛点：营销文案像“群发消息”，转化率只有2%

某美妆品牌的线上营销团队有个头疼的问题：每天发10万条推送，但转化率只有2%。核心原因是：

文案“千人一面”：不管用户是“健身党”还是“职场人”，都发“这款口红显白”；
不懂“用户需求”：用户经常在社交平台发“健身后口红脱妆”，但文案还是“持久不沾杯”（没点出“健身场景”）；
无法“动态调整”：用户上周买了粉底，这周还发“粉底促销”，让用户觉得“被骚扰”。

提示系统设计：“三阶段用户画像-文案生成系统”

提示工程架构师的解决方案是将“用户数据”与“提示系统”深度绑定，让文案从“通用”变成“用户专属”。具体逻辑如下：

第一阶段：用户画像提取——从“数据”到“标签”

核心目标：将用户的“行为数据”（比如购买记录、浏览记录、社交动态）转化为“可用于文案的标签”。
数据来源：

内部数据：订单记录（购买过“健身装备”“哑光口红”）、浏览记录（最近看了“持久口红”）；
外部数据：社交平台动态（用户发了“健身后口红全掉了，求推荐！”）。
Prompt设计：

用户数据：  
1. 购买记录：2023-11-05买了“健身瑜伽垫”，2023-12-01买了“哑光口红（色号#999）”；  
2. 浏览记录：最近7天看了3次“持久不脱妆口红”；  
3. 社交动态：2024-01-05发朋友圈：“健身后口红全掉了，喝个水都尴尬！”  
请你完成以下任务：  
1. 提取用户的“核心需求标签”（比如“健身场景”“持久不脱妆”“哑光质地”）；  
2. 提取用户的“潜在需求”（比如“需要适合健身的口红”）；  
3. 输出格式：{"core_tags": ["健身场景", "持久不脱妆", "哑光质地"], "potential_need": "适合健身的持久口红"}

关键技巧：用“具体数据”替代“模糊描述”，让大模型更准确地提取标签。

第二阶段：文案生成——从“标签”到“个性化内容”

核心目标：根据用户标签，生成“符合用户场景”的文案（比如“健身党必入”而不是“大家都爱”）。
Prompt设计：

已知：  
- 用户核心标签：["健身场景", "持久不脱妆", "哑光质地"]；  
- 潜在需求：适合健身的持久口红；  
- 商品信息：新品口红（色号#888，哑光质地，持妆8小时，防汗防摩擦）；  
- 品牌调性：年轻、活力、懂健身女孩的需求；  
请你生成朋友圈文案，要求：  
1. 开头用“用户场景”（比如“健身党看过来！”）；  
2. 中间讲“商品卖点”（结合用户标签：持久8小时、哑光、防汗）；  
3. 结尾用“召唤行动”（比如“赶紧冲，健身再也不用补口红！”）；  
4. 避免使用“显白”“好看”这类通用词汇，要用“健身后不脱妆”“喝温水不沾杯”这类具体场景词汇。

生成示例：

“健身党看过来！这款哑光口红我连跳3节操都没脱！
8小时持妆+防汗防摩擦，举铁、跑跳、喝温水都不怕沾杯～
色号#888是黄皮显白的暖棕调，健身时涂也超有气色！
再也不用中途跑到卫生间补口红，赶紧冲！”

第三阶段：动态调整——从“一次性”到“持续优化”

核心目标：根据用户的“反馈数据”（比如点击、购买、退订），动态调整文案策略。
实现方式：用A/B测试工具Optimizely，将用户分成两组：

对照组：发送通用文案（“这款口红显白持久”）；
实验组：发送个性化文案（“健身党必入，持妆8小时”）；
根据转化率、点击率数据，优化Prompt（比如如果“健身场景”的转化率高，就增加“健身”相关的标签权重）。

效果：转化率从2%到14%，复购率提升25%

营销转化率：从2%提升至14%（实验组数据）；
用户点击率：从5%提升至28%（个性化文案更吸引用户点击）；
复购率：从18%提升至43%（用户觉得“品牌懂我”）；
品牌反馈：“以前用户说我们的文案‘没感觉’，现在很多用户评论‘这就是我想要的！’”

经验教训：文案的“个性化”不是“换个名字”，是“匹配场景”

错误尝试：一开始我们用“用户名字+通用文案”（比如“小明，这款口红显白”），结果转化率没提升；
修正方向：用“用户场景标签”替代“名字”，让文案“贴合用户的生活”；
关键结论：个性化营销的核心不是“知道用户是谁”，而是“知道用户在什么场景下需要你的产品”。

项目3：科研辅助——从“读文献”到“挖知识”

业务痛点：研究员花80%时间“读文献”，20%时间“做研究”

某生物医药公司的研发团队有个致命问题：每个研究员每月要读50+篇英文文献，但真正能用到研究中的信息不到10%。核心原因是：

文献太长：一篇文献有20+页，大模型的上下文窗口不够（比如GPT-4的上下文是8k tokens，约6000字）；
信息分散：靶点的作用机制可能在“结果”部分，实验数据在“方法”部分，需要手动整合；
输出非结构化：读完文献后，研究员要手动整理成Excel，耗时耗力。

提示系统设计：“分块-摘要-关联”长文本处理系统

提示工程架构师的解决方案是用“分块+向量数据库+关联提示”解决长文本问题，让大模型从“读文献”变成“挖知识”。具体逻辑如下：

第一步：文献分块——把“长文本”切成“可处理的小块”

核心目标：将长文献分成“语义完整”的小块（比如每块讲一个“实验结果”或“机制分析”）。
实现方式：用LangChain的“RecursiveCharacterTextSplitter”工具，按“段落+语义”分块（比如每块不超过1000字，确保语义完整）。
示例：将一篇20页的文献分成15个块，每个块对应“引言”“实验方法”“结果1（靶点A的表达）”“结果2（靶点A与疾病B的关系）”等。

第二步：块摘要——把“小块”变成“关键信息”

核心目标：为每个块生成“结构化摘要”，提取“核心知识点”（比如“靶点名称”“实验方法”“结论”）。
Prompt设计（以“结果1”块为例）：

以下是文献的一个块：  
“我们通过Western blot实验检测了疾病B患者的组织样本，发现靶点A的表达水平比健康对照组高3倍（p<0.01）。进一步的免疫组化实验显示，靶点A主要表达在病变组织的上皮细胞中。”  
请你完成以下任务：  
1. 提取“实验技术”（Western blot、免疫组化）；  
2. 提取“核心发现”（靶点A在疾病B患者中高表达3倍，主要表达在上皮细胞）；  
3. 提取“统计显著性”（p<0.01）；  
4. 输出格式：{"experiment_tech": ["Western blot", "免疫组化"], "key_finding": "靶点A在疾病B患者中高表达3倍，主要表达在上皮细胞", "stat_significance": "p<0.01"}

第三步：关联整合——把“小块摘要”变成“完整知识网络”

核心目标：将多个块的摘要关联起来，形成“靶点A的作用机制”“靶点A与疾病B的关系”等完整知识点。
Prompt设计：

已知以下块摘要：  
1. 块1：靶点A在疾病B患者中高表达3倍（p<0.01），主要表达在上皮细胞；  
2. 块2：用siRNA沉默靶点A后，疾病B细胞的增殖能力下降了70%（p<0.001）；  
3. 块3：靶点A通过激活PI3K/AKT通路促进细胞增殖；  
请你完成以下任务：  
1. 整合靶点A与疾病B的关系（比如“靶点A高表达→激活PI3K/AKT通路→促进细胞增殖→导致疾病B”）；  
2. 输出格式：{"mechanism": "靶点A在疾病B患者中高表达，通过激活PI3K/AKT通路促进细胞增殖，从而导致疾病B", "evidence": ["块1（高表达）", "块2（沉默后增殖下降）", "块3（通路激活）"]}

第四步：结构化输出——把“知识”变成“可复用的数据库”

核心目标：将整合后的知识输出为JSON格式，直接导入企业的“靶点知识库”。
示例输出：

{
  "target_name": "靶点A",
  "disease": "疾病B",
  "mechanism": "靶点A在疾病B患者中高表达，通过激活PI3K/AKT通路促进细胞增殖，从而导致疾病B",
  "evidence": [
    {"block": "块1", "content": "高表达3倍，p<0.01"},
    {"block": "块2", "content": "沉默后增殖下降70%，p<0.001"},
    {"block": "块3", "content": "激活PI3K/AKT通路"}
  ],
  "experiment_tech": ["Western blot", "免疫组化", "siRNA"]
}

效果：文献处理效率提升10倍，研发周期缩短6个月

处理时间：原来研究员读一篇文献需要2天，现在大模型处理只需2小时；
信息利用率：从10%提升至75%（大模型能整合分散的信息）；
研发周期：某靶点的前期研究周期从18个月缩短至12个月；
研究员反馈：“以前我是‘文献搬运工’，现在我是‘知识分析师’，终于能把时间花在真正的研究上了。”

经验教训：长文本处理的核心是“分而治之”，不是“强行喂给大模型”

错误尝试：一开始我们直接把整篇文献喂给GPT-4，结果大模型“遗漏关键信息”（比如后面的实验结果覆盖了前面的）；
修正方向：用“分块+摘要+关联”，让大模型“先处理小块，再整合全局”；
关键结论：大模型的上下文窗口是“硬限制”，但“分而治之”的提示系统能突破这个限制。

四、提示工程架构的“底层方法论”：三阶段闭环

从上面三个项目中，我们可以总结出提示工程架构师的核心方法论——“需求拆解→系统设计→迭代优化”三阶段闭环。

1. 第一阶段：需求拆解——把“业务问题”变成“AI可执行的任务”

很多人犯的错误是“直接让AI解决业务问题”（比如“提升客服满意度”），但大模型无法理解“抽象的业务目标”。提示工程架构师的第一步是将业务问题拆解为“可测量、可执行的AI任务”。
示例：将“提升客服满意度”拆解为：

任务1：意图识别准确率≥95%；
任务2：解决方案匹配准确率≥90%；
任务3：情感安抚回复的用户满意度≥85%。

2. 第二阶段：系统设计——用“模块化”替代“一次性”

提示工程架构师不会设计“一个大Prompt”，而是设计**“多个模块化的Prompt+数据流动规则”**。每个模块负责一个具体任务（比如意图识别、摘要生成），模块之间通过“上下文变量”传递数据（比如意图识别的结果传递给解决方案模块）。
关键原则：

模块化：每个模块只做一件事，便于维护和优化；
可配置：模块的Prompt可以根据业务需求调整（比如换个品牌调性，只需修改文案生成模块的Prompt）；
可监控：每个模块的效果可以单独测量（比如意图识别模块的准确率）。

3. 第三阶段：迭代优化——用“数据”而不是“感觉”调整系统

提示工程架构师不会“拍脑袋”优化Prompt，而是用“量化数据”和“用户反馈”驱动迭代。常见的迭代方法包括：

A/B测试：对比不同Prompt系统的效果（比如两种意图识别Prompt的准确率）；
用户反馈：收集客服、研究员、用户的反馈（比如“这个回复太生硬”）；
数据监控：跟踪关键指标（比如客服满意度、营销转化率）。

五、未来：提示工程架构师的“进化方向”

随着大模型技术的发展，提示工程架构师的角色也在进化。未来，他们将从“系统设计者”变成“系统优化者”，甚至“系统管理者”。以下是三个关键趋势：

1. 自动化提示生成：从“手动写Prompt”到“AI生成Prompt”

比如OpenAI的“Function Calling”、Anthropic的“Prompt Chaining”，这些技术能让AI根据业务需求“自动生成Prompt系统”。提示工程架构师的工作将从“写Prompt”变成“监督AI生成的Prompt是否符合业务规则”。

2. 多模态提示系统：从“文本”到“文本+图像+语音”

未来的AI应用将是多模态的（比如智能导购机器人需要处理“用户的语音问题+展示的商品图像”），提示工程架构师需要设计“多模态提示系统”——比如用图像识别模块提取商品特征，用语音识别模块提取用户意图，再用文本Prompt生成回复。

3. 行业化提示框架：从“通用”到“垂直行业”

比如医疗行业的“临床文档总结提示框架”、金融行业的“风险评估提示框架”，这些行业化框架将包含“行业特有的业务规则”（比如医疗的“隐私保护”、金融的“合规要求”），提示工程架构师需要深入理解行业，设计“符合行业规范的提示系统”。

六、结论：提示工程架构师——AI落地的“最后一公里”工程师

回到文章开头的问题：为什么很多大模型应用落地失败？因为缺少“把业务需求翻译成大模型语言”的人。而提示工程架构师，就是这个“最后一公里”的工程师——他们不是“大模型专家”，也不是“业务专家”，而是“连接两者的翻译官”。

在创新实验室的项目中，我们看到：提示工程架构师的价值不是“让大模型更聪明”，而是“让大模型更懂业务”。他们用“分层提示”解决客服的“答非所问”，用“用户标签”解决营销的“千人一面”，用“分块关联”解决科研的“文献过载”——这些都是大模型本身做不到的，必须靠“人的设计”。

最后，我想对企业说：如果你想让大模型真正落地，别只买大模型API，先招提示工程架构师；对开发者说：如果你想进入AI落地领域，别只学大模型原理，先学提示工程架构。因为未来的AI竞争，不是“谁的模型更大”，而是“谁的提示系统更懂业务”。

七、附加部分

参考文献/延伸阅读

OpenAI. (2023). Prompt Engineering Guide.
Anthropic. (2024). Prompt Design Best Practices.
LangChain. (2024). Conversational Memory Documentation.
麦肯锡. (2023). Generative AI Adoption in Enterprises.

致谢

感谢创新实验室的所有同事，尤其是提示工程团队的小明、小红和小刚——没有他们的实战经验，就没有这篇文章的内容。同时感谢所有合作企业的客户，是你们的痛点让我们的工作有了意义。

作者简介

我是李阳，资深AI工程师，专注于大模型落地和提示工程架构设计。曾主导10+企业级大模型项目，覆盖零售、美妆、生物医药等行业。我的公众号“AI落地笔记”会分享更多大模型落地的实战经验，欢迎关注。

行动号召：
如果你正在做大模型落地项目，遇到了“Prompt不管用”“AI答非所问”的问题，欢迎在评论区留言——我会选出10个问题，免费提供提示系统设计建议！
如果你是提示工程爱好者，也欢迎分享你的经验——让我们一起推动AI从“实验室”走进“生产车间”！

北京朝阳AI社区

更多推荐

浅谈人工智能

这就要追溯到1950年，1950年，图灵在那篇名垂青史的论文《计算机械与智力》里面，阿兰·图灵表达了对人工智能发展的信心，在这篇文章里面，图灵提出了一个模仿游戏：“一场正常的模仿游戏有ABC三人参与，A是男性，B是女性，两人坐在房间里；“这里面我认为最大的漏洞就是，在这个Chinese room argument中预先的肯定了一套指令集（能够根据问题查找对照手册的程序）的存在，而且这个实验只是测翻

北京朝阳AI社区

Agentic AI遇上金融服务创新，提示工程架构师一马当先

想象一下，在一个繁华都市的金融中心，银行、投资公司、保险公司等各类金融机构如同忙碌的蜂巢，人们在这里进行着各种复杂的金融交易与服务。然而，随着金融业务量的爆炸式增长以及客户需求的日益多样化，传统的金融服务模式正面临着前所未有的挑战。就在这时，Agentic AI（智能代理人工智能）如同一位神秘的技术魔法师，悄然踏入了这个金融世界。它能像一个聪明的金融助手一样，自动处理复杂的金融任务，根据客户的个性

北京朝阳AI社区

提示工程架构师进阶：Agentic AI与NLP的完美结合

当对话历史很长时，记忆模块会存储大量冗余信息（比如重复的问题），导致LLM的输入过长（超过上下文窗口）。这时可以用摘要技术总结对话历史，减少冗余。（1）定义摘要函数：用库中的预训练模型（比如# 加载预训练模型（用于文本摘要）# 定义摘要函数"""总结长文本"""# 初始化记忆模块（用摘要技术总结长对话）llm=llm, # 用于生成摘要的LLMmax_token_limit=500 # 当对话历史