Lw中个人主页

@weixin_43894879

Lw中

2022-06-24 21:19:55 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

Agent记不住历史信息？

AI系统在处理长文本或多轮对话时容易出现"失忆"问题，主要受限于Transformer架构的上下文窗口限制和信息稀释效应。本文介绍了六种提升AI记忆能力的方法：1）上下文缓存与滑动窗口；2）向量数据库+RAG检索；3）MemoryTransformer架构；4）∞-former理论无限长处理；5）层次化记忆架构；6）多Agent记忆共享。这些方案从简单到复杂，可根据不同场景需求

#人工智能

如何让Agent智能选工具？

本文系统介绍了让AI Agent智能选择工具的四种方法：规则匹配、LLM自由生成、Softmax采样和Gumbel-Softmax。规则匹配简单但泛化差；LLM生成利用语义但输出不稳定；Softmax引入概率却无法训练；Gumbel-Softmax通过可微的离散采样实现端到端学习，让Agent能从错误中不断优化，准确理解语义并选择合适工具。文章对比了各方法的优缺点，并指出Gumbel-Softma

#人工智能

提示词效果不稳定？

摘要：本文探讨了提示词效果不稳定的问题及解决方案。通过分析语义模糊、缺乏上下文等四大原因，提出"上下文融合Prompt工程"概念，即通过提供背景信息提升模型理解。重点介绍了五种实用策略：少样本提示、思维链推理、外部知识引入、对话历史融合和结构化模板，并介绍了动态上下文注入的进阶方法。实践表明，合理融入上下文能显著提升生成质量，建议明确任务目标、收集相关上下文、优化提示结构并控制

#人工智能 #RAG

大模型生成内容出错

摘要：本文探讨了大模型生成内容中的"幻觉"问题，提出融合事实验证链与溯源标注机制的RAG优化方案。通过LlamaIndex和LangChain框架的代码实战，展示了如何强制模型在输出答案时同步标注关键事实来源，实现答案与证据的强关联。该方案具有可审计性、幻觉抑制和信任增强三大优势，能够有效管控大模型输出质量，使AI系统真正做到"言之有据"。文章详细介绍了两种

#人工智能 #RAG

模型忽略关键实体怎么办？

摘要：针对大语言模型忽略关键实体的问题，本文提出三种解决方案。首先分析问题的根源在于注意力机制对重要实体的权重分配不足，导致模型答非所问。解决方法包括：1）提示词工程，通过明确要求引导模型关注特定内容；2）命名实体识别，预先提取关键实体作为额外信息；3）输出层干预技术，直接调整关键实体的生成概率。三种方法各具优势，可单独或组合使用，其中输出层干预效果最直接但需控制力度。实际应用中建议根据需求选择合

#人工智能

RAG多路召回融合难？

摘要：多路召回融合是提升RAG系统检索质量的关键技术。文章分析了单一检索方式的局限性，提出同时使用向量检索、关键词匹配和知识图谱等多路召回策略。针对融合过程中的三大难点（得分不可比、结果重复、阈值难定），介绍了四种实用策略：加权融合（分配权重计算综合得分）、去重处理（保留唯一文档）、阈值过滤（动态剔除低分结果）和大模型重排序（利用LLM精细评分）。文章强调应根据业务场景在效率与质量间权衡，建议组合

#人工智能 #算法 #RAG

RAG向量检索HNSW参数调优难？

HNSW算法在向量检索中性能优越但内存占用大，Faiss的SQ8量化技术可将128维向量的内存占用从512字节压缩至128字节，降低75%。实验显示，10万条128维向量数据的内存从48.83MB降至12.21MB，训练时间从27.73秒缩短到4.65秒，同时保持60%的Top-1结果一致性。通过调整M、efConstruction等参数可平衡速度与准确率，SQ8适用于移动端等内存敏感场景，SQ1

#python #人工智能 #算法

RAG如何选择最适合业务的向量检索引擎？

RAG系统检索引擎选型指南：BM25、FAISS和HNSW对比分析在RAG系统中，检索引擎的选择直接影响系统性能。本文对比了三种主流方案：BM25基于关键词匹配，适合冷启动和小规模数据，可解释性强但无法语义匹配；FAISS采用向量近似搜索，适合百万级数据，支持GPU加速但训练成本高；HNSW基于图结构索引，召回率高且延迟低，但内存占用大。选型需综合考虑数据量(10万以下用BM25，百万级用HNS

#算法 #人工智能 #RAG

RAG动态切片策略与重叠机制

本文探讨了RAG系统中文档切片的核心问题——上下文碎片化及其解决方案。文章分析了固定切片导致语义断裂、信息稀释等三大影响，提出动态切片和重叠机制两种互补策略：动态切片通过语义/结构感知实现自适应切分（如LlamaIndex的SemanticSplitter），重叠机制则通过保留10%-20%重复内容维护连贯性。同时介绍了层次化检索（Dify父子模式）、命题检索等进阶方案，以及商业工具（RAGFlo

#人工智能 #python #算法 +1

RAG跨页表格怎么自动对齐合并？

摘要：RAG系统中跨页表格处理面临表头重复、行列错位等挑战。本文提出通过表格结构识别(TSR)、合并策略和结构化输出三个关键技术实现自动对齐，并演示使用开源工具MinerU的完整流程：部署环境→解析PDF→输出结构化Markdown/JSON→集成到RAG系统。该方案能有效还原表格完整性，提升检索与生成质量，建议对PDF文档进行预处理以避免信息丢失。

共 15 条

请选择