收藏必备！为什么有了DeepSeek还要用RAG？大模型知识增强与流程控制完全解析

RAG技术通过检索最相关上下文传递给大模型，解决了上下文长度限制和计算成本问题。它实现了信息聚焦（确保AI基于特定知识回答）和流程控制（按预设推理），是对大模型能力的增强而非替代。当需要基于特定知识做出准确回答时，RAG成为必选项，使AI从"通用对话"走向"专业赋能"。

AI绘画哇哒哒

1003人浏览 · 2025-10-09 11:36:08

AI绘画哇哒哒 · 2025-10-09 11:36:08 发布

大模型和RAG一样，都是针对用户的问题，给出答复，那么，为什么有问题不直接问deepseek，还要跑一遍RAG？

RAG的出现，从根本上解决了大模型在处理知识时的一个核心痛点：如何高效、准确且低成本地利用那些未训练过的、私有的或最新的知识来回答问题。

如果我们希望大模型根据某些特定的知识内容生成答案，就必须将这些知识提供给模型。

似乎我们可以把这些知识全部发送给模型，但实际上并不可行

一方面，大模型本身的上下文长度有限，无法一次性处理大量内容

另一方面，即使上下文窗口未来不断扩大，每次提问都传入海量文档也会导致计算成本高昂、响应速度慢，并且可能引入无关信息干扰模型判断。

RAG通过“检索-增强-生成”的方式，针对用户的问题，系统首先在专用知识库中检索最相关的信息片段，仅将这些精选出的上下文传递给大模型。这样既克服了长度限制、降低了成本，也确保了模型作答的依据始终聚焦在我们提供的权威知识内。

同时，借助RAG的工作流设计，我们还可以控制大模型的思考路径，使其按照预设流程推理，而非随意发挥，进一步提升了回答的准确性与可靠性。

接下来，我们通过两个例子，详细介绍下如何用RAG实现信息聚焦和流程控制

信息聚焦

举一个沟通问题的例子。

比如我和我的室友沟通不太顺畅，希望AI可以给我一些建议。我希望AI使用《非暴力沟通》这本书的知识来指导我的沟通。

于是我问deepseek

我的室友经常不收拾屋子，让我很烦躁，所以我跟他说：“你总是不收拾屋子，让我很烦躁”，室友听了后显得很生气并且没有什么改变，我应该怎么跟他沟通才能解决这个问题

很明显，AI虽然给出了回答，但是不是我想要的，因为我希望使用到《非暴力沟通》的知识

当然，如果在提示词中，直接说明需要使用《非暴力沟通》的知识回答，deepseep也可以给我们想要的答案，这是因为DeepSeek在训练过程中很可能学习过这本书的相关内容，所以它能理解并执行这个指令

但是实际业务中，可能AI的最初训练资料中没有相关知识，所以你即使指定所用知识，AI也是无法回答的

此时，我们引入了RAG，来看看AI的回答

我们使用coze搭建一个简单的RAG

在COZE中，创建知识库并上传知识内容时，COZE按照一定的规则，做出知识分块、向量化等操作，我们不需要太复杂的工序即可搭建一个RAG

这里是使用《非暴力沟通》的PDF版本上传后作为一个知识库，然后在agent中调用这个知识库，让我们看看引入RAG后的回答

可以看到，我们使用了和给到deepseek相同的提示词，但是在这个回答中，AI给出的第一个回答正是按照书中观察、感受、需要、请求的四个要素给出沟通建议

当然，如果我们给deepseek的问题中，指定需要用非暴力沟通的方式作答，也是可以满足需求的

这是因为，当我没有指定用什么知识回答时，deepseek的知识范围是所有的训练内容，那就势必会让知识太过繁杂，导致无法按照我的预想回答。但是当我指定用非暴力沟通的知识回答时，deepseek也可以在他的训练知识中，提取这一块知识来回答

由此可以看出，当我们想要聚焦知识，或者有些知识不在大模型的初始训练知识内时，使用RAG，是一种实现目的的途径，将需要的信息整理到知识库内，通过知识库内的检索，让AI生成我们需要的答案

流程控制

仅仅让AI“知道”知识还不够，我们更需要它按照我们设定的专业流程来思考和工作，从而保证输出结果的高度一致性和专业性。这就是使用RAG的另一个强大能力——流程控制。

我们以一个非常实际的场景为例：一个自主研发的WMS（仓库管理系统）需要出海，所有界面、菜单、提示的文本都需要翻译成英文。

如果单纯靠人或直接让大模型翻译，会面临很多问题：

不统一：不同的人对同一个词可能有不同的翻译。比如，“库位”有人译成 Location，有人译成 Storage Location，甚至可能是 Bin。
不专业：某些术语在物流行业有固定叫法。比如，“波次拣货”翻译成 Wave Picking 是专业术语，而按字面翻译成 Batch Order Picking 就显得很不专业。
风格不一：对于大小写（是 Order 还是 order）、动词名词形式（是 Confirm 还是 Confirmation）没有统一规范。

直接提问大模型：“请将‘入库订单’翻译成英文”，你可能会得到各种答案，因为它没有上下文。

而通过RAG，我们可以构建一个专业的翻译工作流，让AI像一支训练有素的本地化团队一样工作。

整体思路如下

构建知识库：我们创建三个核心知识库。

翻译规范库：存放强制性的翻译规则。例如：“‘货品’统一译为 Item，首字母大写”、“所有状态动词统一使用现在分词形式，如‘盘点中’译为 Counting...”、“‘库位’统一使用 Bin 而非 Location”。
历史翻译库：存放已经审核通过的现有翻译键值对，作为最重要的参考。例如：{“入库订单”: “Inbound Order”, “出库订单”: “Outbound Order”}。
行业术语库：存放物流行业的通用英文术语标准，用于翻译新词或验证专业性。

设计控制流程：当接到一个翻译请求（例如：翻译“待上架货品”）时，AI不会直接回答，而是严格按照以下流程执行：

第一步：检索

首先，去翻译规范库检索是否有关于“货品”、“待”等字的强制规则。
然后，去历史翻译库精确检索“待上架货品”是否有现成翻译。如果没有，则检索类似结构，如“待收货”、“待入库”的翻译是什么。
最后，去行业术语库检索“上架”的标准专业术语是什么（通常是 Putaway 或 Storing）。

第二步：推理与生成

AI会综合所有检索到的信息进行推理：“历史库中‘货品’规定译为 Item，‘待’字前缀历史中常用 Pending（如‘待收货’是 Pending Receipt）。行业库中‘上架’是 Putaway。没有强制规则冲突。”
最终，它生成的翻译是：Pending Putaway Item。这个结果既符合内部规范，又保持了历史统一性，还具备了行业专业性。

另一个例子：翻译一个全新的词“库存水位预警”。

在历史库和规范库中都找不到直接答案。
AI流程会先在行业库中检索“库存水位”和“预警”的标准说法，可能会找到 Inventory Level 和 Alert。
然后它会参考历史翻译中“预警”是放在前面还是后面（例如“温度预警”是译作 Temperature Alert）。
最终组合出符合公司习惯和专业性的 Inventory Level Alert。

通过这样的流程控制，我们不再是简单地向AI提问，而是命令它执行一个复杂的、多步骤的决策程序。这确保了即使负责翻译的人员不断变动，AI也能作为一个永不离职、严格遵循SOP（标准作业程序）的专家，输出稳定、可靠、高质量的翻译结果。

总结

总而言之，RAG 的出现并非是为了替代像 DeepSeek 这样的大模型，而是对其能力的一种关键增强。

选择直接提问大模型还是使用RAG，本质上是选择“开放探索”与“精准执行”两种不同的模式。如果任务目标不是获取灵感，而是要求基于特定知识做出准确、可靠回答时，RAG就从一个可选项变为了必选项。它可以让AI从“通用对话”走向“专业赋能”的关键一步

普通人如何抓住AI大模型的风口？

领取方式在文末

为什么要学习大模型？

目前AI大模型的技术岗位与能力培养随着人工智能技术的迅速发展和应用，大模型作为其中的重要组成部分，正逐渐成为推动人工智能发展的重要引擎。大模型以其强大的数据处理和模式识别能力，广泛应用于自然语言处理、计算机视觉、智能推荐等领域，为各行各业带来了革命性的改变和机遇。

目前，开源人工智能大模型已应用于医疗、政务、法律、汽车、娱乐、金融、互联网、教育、制造业、企业服务等多个场景，其中，应用于金融、企业服务、制造业和法律领域的大模型在本次调研中占比超过 30%。
在这里插入图片描述

随着AI大模型技术的迅速发展，相关岗位的需求也日益增加。大模型产业链催生了一批高薪新职业：
在这里插入图片描述

人工智能大潮已来，不加入就可能被淘汰。如果你是技术人，尤其是互联网从业者，现在就开始学习AI大模型技术，真的是给你的人生一个重要建议！

最后

只要你真心想学习AI大模型技术，这份精心整理的学习资料我愿意无偿分享给你，但是想学技术去乱搞的人别来找我！

在当前这个人工智能高速发展的时代，AI大模型正在深刻改变各行各业。我国对高水平AI人才的需求也日益增长，真正懂技术、能落地的人才依旧紧缺。我也希望通过这份资料，能够帮助更多有志于AI领域的朋友入门并深入学习。

真诚无偿分享！！！
vx扫描下方二维码即可
加上后会一个个给大家发
在这里插入图片描述

大模型全套学习资料展示

自我们与MoPaaS魔泊云合作以来，我们不断打磨课程体系与技术内容，在细节上精益求精，同时在技术层面也新增了许多前沿且实用的内容，力求为大家带来更系统、更实战、更落地的大模型学习体验。

希望这份系统、实用的大模型学习路径，能够帮助你从零入门，进阶到实战，真正掌握AI时代的核心技能！

01 教学内容

从零到精通完整闭环：【基础理论 →RAG开发 → Agent设计 → 模型微调与私有化部署调→热门技术】5大模块，内容比传统教材更贴近企业实战！
大量真实项目案例： 带你亲自上手搞数据清洗、模型调优这些硬核操作，把课本知识变成真本事‌！

02适学人群

应届毕业生‌： 无工作经验但想要系统学习AI大模型技术，期待通过实战项目掌握核心技术。

零基础转型‌： 非技术背景但关注AI应用场景，计划通过低代码工具实现“AI+行业”跨界‌。

业务赋能突破瓶颈： 传统开发者（Java/前端等）学习Transformer架构与LangChain框架，向AI全栈工程师转型‌。

vx扫描下方二维码即可
在这里插入图片描述

本教程比较珍贵，仅限大家自行学习，不要传播！更严禁商用！

03 入门到进阶学习路线图

大模型学习路线图，整体分为5个大的阶段：

04 视频和书籍PDF合集

从0到掌握主流大模型技术视频教程（涵盖模型训练、微调、RAG、LangChain、Agent开发等实战方向）

新手必备的大模型学习PDF书单来了！全是硬核知识，帮你少走弯路（不吹牛，真有用）

05 行业报告+白皮书合集

收集70+报告与白皮书，了解行业最新动态！

06 90+份面试题/经验

AI大模型岗位面试经验总结（谁学技术不是为了赚$呢，找个好的岗位很重要）
在这里插入图片描述

07 deepseek部署包+技巧大全

在这里插入图片描述

由于篇幅有限

只展示部分资料

并且还在持续更新中…

真诚无偿分享！！！
vx扫描下方二维码即可
加上后会一个个给大家发
在这里插入图片描述

北京朝阳AI社区

更多推荐

揭秘国产Lerwee运维智能体的场景，它是如何让小白也能快速上手？

北京朝阳AI社区

*********调度指令识别

下面按“6 大类、17 子类”给出可直接落地的收集清单，全部来源公开、可商用或已脱敏，附带获取入口与建议量级，方便后续做“五要素+情绪+紧急度”多任务标注。一句话总结“先拿运营公司原生语音+ATS日志做骨架，再用规范教材和开源通用库做肌肉，最后用合成与方言数据做皮肤”，30 万句级多任务语料库即可在 6 个月内闭环，满足地铁调度指令质检模型的训练与评测需求。“规则保底线、小模型保速度、数据闭环保进