RAG检索增强生成：大模型知识库搭建与优化完全指南

RAG（检索增强生成）是将大语言模型与外部知识库检索结合的框架，通过向量数据库解决LLM知识更新困难和幻觉问题。实现流程包括文本向量化处理和基于用户查询的语义检索。优化方向涵盖分块策略、embedding模型选择、提示词设计、查询优化和生成质量提升。RAG相比微调成本更低，效果显著，是当前大模型应用的重要技术路线。

m0_63171455

585人浏览 · 2025-10-06 07:00:00

m0_63171455 · 2025-10-06 07:00:00 发布

简介

RAG（Retrieval Augmented Generation，检索增强生成）是一个将大语言模型（LLM）与来自外部知识源的检索相结合的框架，以改进问答能力的工程框架。
通俗来说就是给大语言模型外挂一个知识库（通常是向量数据库），使其获得自身未能掌握的数据、知识。
因此RAG基本解决了LLM知识更新困难以及幻觉问题。

RAG工程相较于微调大语言模型的成本会低很多，且目前随着 RAG 工程的发展，其最终实现效果也很不错。

RAG的实现流程

• 第一个大步骤就是将文本数据处理并进行向量化转化处理。这一步一般会用到 embedding 模型将文本块转化为向量并存储到向量数据库。
• 第二个大步骤则是根据用户输入的问题，在向量数据库中进行检索临近的文本块，整合个大模型输出最后的回复。

传统的文件知识库是用关键词匹配检索，而向量数据库是用语义匹配检索。

RAG的优化

优化其实就是针对RAG实现流程的各个节点进行优化，其中可能有些名词过于技术，产品经理做个了解即可，主要还是对可以优化的方向有个整体认知。

优化分块（chunk）
1️⃣选择合适的分块大小，并使用语义分块等高级分块策略，以确保检索到的Chunk 包含完整的上下文信息。同时可以使用滑动窗口增加上下文信息。
2️⃣有些时候文档内容会比较冗余，此时可以考虑对文档进行总结，减少冗余信息。

优化embedding
1.挑选合适的 embedding 模型：检索任务通常是判断两段内容是否相关，相似任务是判断两段内容是否相似，相关的内容不一定相似。
2.针对任务进行微调：embedding 模型的训练预料和实际检索的语料分布可能并不相同，此时在对应语料上进行 finetuning 可以显著提升检索到的内容的相关性。比如 OpenAI 也提供了代码相关的 code embedding 模型。
3.Adapter：也有研究者引入Adapter，在提取 query embedding 后进一步让 embedding 经过 Adapter，以便实现与索引更好的对齐。

优化提示词（prompt）
设计清晰、明确的Prompt，指导LLM 更好地利用检索到的上下文信息。同时要使用Prompt 工程技巧，详情可以参考ALL About AI 系列（二）：提示词工程。

优化Query
1.Query 改写：对用户输入 query 进行修改或重写，通常只调整 query 结构、添加或删除关键词，或者通过近义词替换来扩展检索范围。
2.Query 纠错：通常是指尝试修正用户 query 中可能的拼写或语法错误。
3.Query Clarification：通常是指修正或分解用户 query 中不明确或模糊的内容，使系统更好地理解并执行相应的检索，有助于避免歧义。

优化生成
1.使用更强大的LLM，提高生成能力。根据具体任务，对LLM进行Finetune，提高生成效果。
2.使用合适的解码策略，如Top-ksampling、Nucleus sampling等，避免生成重复、不连贯的内容。控制生成长度，避免生成过于冗长的内容。

AI大模型学习和面试资源

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

这份完整版的大模型 AI 学习和面试资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】
在这里插入图片描述

在这里插入图片描述

第一阶段： 从大模型系统设计入手，讲解大模型的主要方法；

第二阶段： 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用；

第三阶段： 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统；

第四阶段： 大模型知识库应用开发以LangChain框架为例，构建物流行业咨询智能问答系统；

第五阶段： 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型；

第六阶段： 以SD多模态大模型为主，搭建了文生图小程序案例；

第七阶段： 以大模型平台应用与开发为主，通过星火大模型，文心大模型等成熟大模型构建大模型行业应用。

在这里插入图片描述

👉学会后的收获：👈

• 基于大模型全栈工程实现（前端、后端、产品经理、设计、数据分析等），通过这门课可获得不同能力；

• 能够利用大模型解决相关实际项目需求：大数据时代，越来越多的企业和机构需要处理海量数据，利用大模型技术可以更好地处理这些数据，提高数据分析和决策的准确性。因此，掌握大模型应用开发技能，可以让程序员更好地应对实际项目需求；

• 基于大模型和企业数据AI应用开发，实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能，学会Fine-tuning垂直训练大模型（数据准备、数据蒸馏、大模型部署）一站式掌握；

• 能够完成时下热门大模型垂直领域模型训练能力，提高程序员的编码能力：大模型应用开发需要掌握机器学习算法、深度学习框架等技术，这些技术的掌握可以提高程序员的编码能力和分析能力，让程序员更加熟练地编写高质量的代码。

在这里插入图片描述

1.AI大模型学习路线图
2.100套AI大模型商业化落地方案
3.100集大模型视频教程
4.200本大模型PDF书籍
5.LLM面试题合集
6.AI产品经理资源合集

👉获取方式：
😝有需要的小伙伴，可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

在这里插入图片描述

北京朝阳AI社区

更多推荐

破解“识字“难题：PaddleOCR如何让机器读懂世界的文字密码

北京朝阳AI社区

全栈3.0：2025年多模态开发能力矩阵

多模态技术的发展使得全栈开发者的角色变得更加复杂，但同时也提供了更多的挑战与机会。未来的全栈开发者不仅需要掌握传统的前端、后端技术，还要能够跨足人工智能、云计算、大数据等多个领域，解决更加复杂的多模态问题。??在这个快速发展的时代，只有不断学习、勇于创新的开发者，才能在2025年的多模态开发环境中脱颖而出，成为行业的领军人物。全栈3.0不仅仅是技术的融合，它代表着开发者全面能力的提升，也预示着更加

北京朝阳AI社区

农业算法工程：无人机遥感与土壤墒情建模

无人机遥感与土壤墒情建模在农业中的应用，是现代农业向智能化、精准化发展的重要标志。通过农业算法工程，农民不仅可以获得数据驱动的科学指导，还能显著提升农业生产效率和作物质量。随着技术不断进步，智慧农业的未来将更加光明?。总之，农业算法工程将无人机遥感、土壤墒情建模、人工智能和大数据紧密结合，为农业生产提供了前所未有的创新方法和工具。未来，我们期待更多的科技创新能够赋能农业，实现绿色、高效、智能的现代