【每天一个知识点】RAG（Retrieval-Augmented Generation）中的检索

RAG框架中检索环节是关键，负责弥补大模型知识盲区、提高生成准确性和控制幻觉。典型流程包括查询转化、文档匹配（稀疏/稠密/混合检索）、结果排序和格式化。检索方式分关键词、Embedding和动态聚类等类型，面临召回不足、长文档处理等挑战。检索质量直接影响生成效果，二者协同工作：检索获取相关知识，生成模型组织语言回答。

dundunmm

744人浏览 · 2025-09-18 14:43:43

dundunmm · 2025-09-18 14:43:43 发布

在 RAG（Retrieval-Augmented Generation） 框架中，检索（Retrieval） 是最核心的环节之一，直接决定了生成模型能否获取到高质量、相关性强的知识支撑。

1. 检索的目标

补充大模型的知识盲区：大模型的参数知识库是静态的，无法覆盖最新或专业的领域知识。检索通过外部知识库弥补这一不足。
提高生成的准确性与可信度：如果检索结果能精确命中用户问题相关的文档/事实，那么生成结果就更具解释力和可溯源性。
控制模型幻觉：通过“先找再答”，减少大模型凭空编造内容的风险。

2. 检索流程

典型的检索步骤包括：

用户查询转化：将用户的自然语言问题转化为检索请求（可能包括关键词抽取、embedding 表示、语义改写）。
文档索引与匹配：在知识库/向量库中，找到与查询最相关的文档片段。
- 稀疏检索（BM25、关键词索引）：更适合短文本、符号化需求。
- 稠密检索（向量检索/embedding 召回）：更适合语义匹配，解决“同义表达”。
- 混合检索（Hybrid Retrieval）：结合两者优势。
候选文档排序（Ranking/Re-ranking）：对初步召回的结果进行精排，确保最相关的片段排在前面。
结果裁剪与格式化：选出前k条结果，压缩为上下文，拼接进Prompt中供生成模型使用。

3. 检索方式的类型

基于关键词的检索：依赖倒排索引和关键词匹配，速度快但语义泛化能力差。
基于Embedding的检索：通过语义向量相似度（如余弦相似度）来判断相关性。
基于聚类/动态组织的检索（高级）：在用户意图驱动下动态聚类，将相关信息聚合成知识单元，再进行匹配（这与你正在研究的 动态聚类记忆RAG 方向高度相关）。
多轮对话中的上下文检索：结合历史对话进行意图追踪和检索扩展。

4. 检索的挑战

召回不足：检索不到关键文档，导致答案缺乏支撑。
召回过宽：引入无关文档，降低生成效果。
长文档处理：如何切分文档（chunking）以平衡上下文完整性与向量召回粒度。
多源融合：如何在数据库、知识库、文档库、API 等多源之间调度检索。

5. 在RAG中的位置

用户问题 → 查询改写 → 检索（文档/知识库/向量库）
                           ↓
              相关文档片段拼接进Prompt
                           ↓
          大模型生成回答（基于检索到的知识）

检索是 “找到对的知识”，生成是 “组织语言回答”。两者互为依赖：检索质量决定了生成的上限。

北京朝阳AI社区

更多推荐

文Spring Boot集成SLF4j详解：从基础到高级实践w

目前主流大模型基本是Decoder-Only的模型架构，所以在生成某个序列的下一个token时，必须要先计算出这个序列所有的顺序token（例如输入的prompt）的Key和Value，这个阶段就是prefill的阶段，这个阶段由于要连续计算多个token的Q、K、V向量（Query、Key和Value向量），所以是计算密集型的任务。在验证这点时，可以做一个理论上的计算。在每一步生成后，调度器会检

北京朝阳AI社区

母本文系统整理了Spring和Spring Boot中的常用注解，按功能分类介绍，涵盖其含义、来源、应用场景及代码示例。a

其实，这种“基础层开放、应用层封闭”的打法，很像当年Google Android的模式，先把底座做好、把开发者圈进来，后面再推自家应用，形成自己的生态链。如果你关注AI、玩过大模型，或者做过智能体产品，比如AI客服、AI助手、虚拟女友这些工具，一定绕不开扣子。也许，下一个爆款产品，就诞生在你的电脑上！不光打破了之前AI生态偏“封闭、绑定”的老套路，还给开发者和企业吃了定心丸，用字节的技术，不怕卡脖

北京朝阳AI社区

Java在人工智能时代的应用前景与挑战

其次，在构建高可用、可扩展的AI服务平台时，Java的微服务架构（如Spring Boot）和成熟的容器化技术（与Docker、Kubernetes无缝集成）能够确保AI服务7x24小时稳定运行。虽然Python因其简洁的语法和丰富的库（如TensorFlow、PyTorch）在AI模型研发与快速原型构建中占主导地位，但Java凭借其固有的优势，在人工智能时代依然扮演着不可或缺的角色。再者，虽然J