RAG(Retrieval-Augmented Generation检索增强生成)是一种AI生成内容时先检索外部知识的技术框架。通俗的说没有RAG就像闭卷考试,大模型只能依据已学知识来回答,有了RAG就像开卷考试,大模型可以先看资料再回答,这样一来RAG可以极大的提高智能体参加“考试”的分数。

这是杰豆的第17篇原创文章

一、为什么不让大模型“真才实学”?

1、费钱

每次模型微调都需要消耗算力资源,且需要专业技术人员,这种算力费用和人力成本就像补习班的培训费

2、费心

就像人学习知识不只是看书一样,大模型学习知识也要准备大量的练习册和标准答案

3、费时

训练速度赶不上知识更新速度,曾经的练习册可能是已淘汰的旧知识

4、可解释

开卷考试情况下,大模型回答不仅可以把答案回答出来,还可以讲所引用的权威来源解释清楚,而离开RAG的大模型,就算回答正确,但在解释为什么这个答案的时候很容易出现“幻觉”,可解释的答案才能更容易被提问者信任。

二、开卷考试前的资料准备

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

1、知识切片

就像你为了开卷考试“拆书做卡片”,RAG也是先把海量的原始知识(比如整本的理化生资料)拆成一个个独立的“知识片段”(即文本分块),再把这些片段转化为向量存入向量库。后续答题(AI生成内容)时,你能快速从“卡片”里找考点,AI也能快速从“知识片段”里找相关信息,本质都是通过“拆小、拆细”提升检索效率。

2、向量存储

向量存储好比如果你参加综合理科开卷考试,你会把细胞学和遗传学的知识卡片放一起(二者同属生物学,知识特征相似),也会把力学和电磁学的知识卡片放一起(二者同属物理学,知识特征相似)。这种根据语义或特征相似的信息进行存储的方式,就是向量存储的核心逻辑。

三、开卷考试中的知识翻找

(图片引用自《大模型RAG实战》)

1、知识召回

好比在考试过程中看到题目后快速在一大堆知识卡片里找到最有可能跟答案相关的5~10张知识卡片,并会根据相似度进行排序。值得注意的是知识召回不一定只从向量知识库里进行检索,联网搜索、结构化数据库检索等方式都算知识召回。

2、知识重排

对从各种方式检索到的知识卡片的排序进行进一步思考,重新选择最有可能和答案相关的资料。

四、开卷考试中的答案生成

实现RAG最后一步“答案生成”,核心是“优质Prompt设计+大模型调用”,其中Prompt(提示词)是关键——它负责把“用户问题”和“检索到的知识”有效整合,告诉大模型“该用什么资料、怎么生成答案”,本质是为大模型划定清晰的“参考范围”和“输出规则”。

以一个社保知识智能体为案例,我们要输出给大模型的优质提示词是:

角色定位

你是专业的企业HR社保咨询顾问,需为用户提供准确、可落地的社保业务办理指导,语言需正式且简洁,避免使用专业术语堆砌。

参考知识(仅基于以下内容回答,不得引用外部信息)

{{检索到的社保知识片段}}
(变量示例:1. 北京地区企业为员工办理社保补缴的条件:员工入职30日内未及时参保,或因企业原因导致社保断缴,且断缴时长不超过3个月;2. 办理材料:企业营业执照副本复印件(加盖公章)、员工身份证复印件、《北京市社会保险补缴申请表》(需员工签字确认)、员工工资发放凭证(近1个月);3. 办理流程:登录北京市社会保险网上服务平台→进入“补缴申报”模块→上传材料并填写补缴信息→提交审核,审核通过后3个工作日内完成补缴,企业需在当月月底前完成费用缴纳。)

生成规则

  1. 严格依据上述参考知识,分“所需材料”和“办理流程”两部分作答,每部分用序号清晰罗列;
  2. 若参考知识中未提及用户问题的相关内容,直接回复“当前暂未查询到该问题的详细解答,建议咨询北京市社保中心官方热线12333”;

本文总结如下:

RAG可以让企业省钱省心省时间的让大模型具备基于企业内部知识进行回答的能力,并且回答的结果可解释,准确率高,值得信任。

RAG分为三个阶段,用开卷考试来比喻:

检索前:开卷考试前准备资料

检索中:开卷考试中的资料翻找

检索后:基于问题和翻找到的资料生成答案

世界变化只会越来越快,我们一起学习AI知识,紧跟时代潮流~

想入门 AI 大模型却找不到清晰方向?备考大厂 AI 岗还在四处搜集零散资料?别再浪费时间啦!2025 年 AI 大模型全套学习资料已整理完毕,从学习路线到面试真题,从工具教程到行业报告,一站式覆盖你的所有需求,现在全部免费分享

👇👇扫码免费领取全部内容👇👇

一、学习必备:100+本大模型电子书+26 份行业报告 + 600+ 套技术PPT,帮你看透 AI 趋势

想了解大模型的行业动态、商业落地案例?大模型电子书?这份资料帮你站在 “行业高度” 学 AI

1. 100+本大模型方向电子书

在这里插入图片描述

2. 26 份行业研究报告:覆盖多领域实践与趋势

报告包含阿里、DeepSeek 等权威机构发布的核心内容,涵盖:

  • 职业趋势:《AI + 职业趋势报告》《中国 AI 人才粮仓模型解析》;
  • 商业落地:《生成式 AI 商业落地白皮书》《AI Agent 应用落地技术白皮书》;
  • 领域细分:《AGI 在金融领域的应用报告》《AI GC 实践案例集》;
  • 行业监测:《2024 年中国大模型季度监测报告》《2025 年中国技术市场发展趋势》。

3. 600+套技术大会 PPT:听行业大咖讲实战

PPT 整理自 2024-2025 年热门技术大会,包含百度、腾讯、字节等企业的一线实践:

在这里插入图片描述

  • 安全方向:《端侧大模型的安全建设》《大模型驱动安全升级(腾讯代码安全实践)》;
  • 产品与创新:《大模型产品如何创新与创收》《AI 时代的新范式:构建 AI 产品》;
  • 多模态与 Agent:《Step-Video 开源模型(视频生成进展)》《Agentic RAG 的现在与未来》;
  • 工程落地:《从原型到生产:AgentOps 加速字节 AI 应用落地》《智能代码助手 CodeFuse 的架构设计》。

二、求职必看:大厂 AI 岗面试 “弹药库”,300 + 真题 + 107 道面经直接抱走

想冲字节、腾讯、阿里、蔚来等大厂 AI 岗?这份面试资料帮你提前 “押题”,拒绝临场慌!

1. 107 道大厂面经:覆盖 Prompt、RAG、大模型应用工程师等热门岗位

面经整理自 2021-2025 年真实面试场景,包含 TPlink、字节、腾讯、蔚来、虾皮、中兴、科大讯飞、京东等企业的高频考题,每道题都附带思路解析

2. 102 道 AI 大模型真题:直击大模型核心考点

针对大模型专属考题,从概念到实践全面覆盖,帮你理清底层逻辑:

3. 97 道 LLMs 真题:聚焦大型语言模型高频问题

专门拆解 LLMs 的核心痛点与解决方案,比如让很多人头疼的 “复读机问题”:


三、路线必明: AI 大模型学习路线图,1 张图理清核心内容

刚接触 AI 大模型,不知道该从哪学起?这份「AI大模型 学习路线图」直接帮你划重点,不用再盲目摸索!

在这里插入图片描述

路线图涵盖 5 大核心板块,从基础到进阶层层递进:一步步带你从入门到进阶,从理论到实战。

img

L1阶段:启航篇丨极速破界AI新时代

L1阶段:了解大模型的基础知识,以及大模型在各个行业的应用和分析,学习理解大模型的核心原理、关键技术以及大模型应用场景。

img

L2阶段:攻坚篇丨RAG开发实战工坊

L2阶段:AI大模型RAG应用开发工程,主要学习RAG检索增强生成:包括Naive RAG、Advanced-RAG以及RAG性能评估,还有GraphRAG在内的多个RAG热门项目的分析。

img

L3阶段:跃迁篇丨Agent智能体架构设计

L3阶段:大模型Agent应用架构进阶实现,主要学习LangChain、 LIamaIndex框架,也会学习到AutoGPT、 MetaGPT等多Agent系统,打造Agent智能体。

img

L4阶段:精进篇丨模型微调与私有化部署

L4阶段:大模型的微调和私有化部署,更加深入的探讨Transformer架构,学习大模型的微调技术,利用DeepSpeed、Lamam Factory等工具快速进行模型微调,并通过Ollama、vLLM等推理部署框架,实现模型的快速部署。

img

L5阶段:专题集丨特训篇 【录播课】

img
四、资料领取:全套内容免费抱走,学 AI 不用再找第二份

不管你是 0 基础想入门 AI 大模型,还是有基础想冲刺大厂、了解行业趋势,这份资料都能满足你!
现在只需按照提示操作,就能免费领取:

👇👇扫码免费领取全部内容👇👇

2025 年想抓住 AI 大模型的风口?别犹豫,这份免费资料就是你的 “起跑线”!

Logo

更多推荐