收藏必备!为什么有了DeepSeek还要用RAG?大模型知识增强与流程控制完全解析
RAG技术通过检索最相关上下文传递给大模型,解决了上下文长度限制和计算成本问题。它实现了信息聚焦(确保AI基于特定知识回答)和流程控制(按预设推理),是对大模型能力的增强而非替代。当需要基于特定知识做出准确回答时,RAG成为必选项,使AI从"通用对话"走向"专业赋能"。
大模型和RAG一样,都是针对用户的问题,给出答复,那么,为什么有问题不直接问deepseek,还要跑一遍RAG?
RAG的出现,从根本上解决了大模型在处理知识时的一个核心痛点:如何高效、准确且低成本地利用那些未训练过的、私有的或最新的知识来回答问题。
如果我们希望大模型根据某些特定的知识内容生成答案,就必须将这些知识提供给模型。
似乎我们可以把这些知识全部发送给模型,但实际上并不可行
一方面,大模型本身的上下文长度有限,无法一次性处理大量内容
另一方面,即使上下文窗口未来不断扩大,每次提问都传入海量文档也会导致计算成本高昂、响应速度慢,并且可能引入无关信息干扰模型判断。
RAG通过“检索-增强-生成”的方式,针对用户的问题,系统首先在专用知识库中检索最相关的信息片段,仅将这些精选出的上下文传递给大模型。这样既克服了长度限制、降低了成本,也确保了模型作答的依据始终聚焦在我们提供的权威知识内。
同时,借助RAG的工作流设计,我们还可以控制大模型的思考路径,使其按照预设流程推理,而非随意发挥,进一步提升了回答的准确性与可靠性。
接下来,我们通过两个例子,详细介绍下如何用RAG实现信息聚焦和流程控制
信息聚焦
举一个沟通问题的例子。
比如我和我的室友沟通不太顺畅,希望AI可以给我一些建议。我希望AI使用《非暴力沟通》这本书的知识来指导我的沟通。
于是我问deepseek
我的室友经常不收拾屋子,让我很烦躁,所以我跟他说:“你总是不收拾屋子,让我很烦躁”,室友听了后显得很生气并且没有什么改变,我应该怎么跟他沟通才能解决这个问题
很明显,AI虽然给出了回答,但是不是我想要的,因为我希望使用到《非暴力沟通》的知识
当然,如果在提示词中,直接说明需要使用《非暴力沟通》的知识回答,deepseep也可以给我们想要的答案,这是因为DeepSeek在训练过程中很可能学习过这本书的相关内容,所以它能理解并执行这个指令
但是实际业务中,可能AI的最初训练资料中没有相关知识,所以你即使指定所用知识,AI也是无法回答的
此时,我们引入了RAG,来看看AI的回答
我们使用coze搭建一个简单的RAG
在COZE中,创建知识库并上传知识内容时,COZE按照一定的规则,做出知识分块、向量化等操作,我们不需要太复杂的工序即可搭建一个RAG
这里是使用《非暴力沟通》的PDF版本上传后作为一个知识库,然后在agent中调用这个知识库,让我们看看引入RAG后的回答
可以看到,我们使用了和给到deepseek相同的提示词,但是在这个回答中,AI给出的第一个回答正是按照书中观察、感受、需要、请求的四个要素给出沟通建议
当然,如果我们给deepseek的问题中,指定需要用非暴力沟通的方式作答,也是可以满足需求的
这是因为,当我没有指定用什么知识回答时,deepseek的知识范围是所有的训练内容,那就势必会让知识太过繁杂,导致无法按照我的预想回答。但是当我指定用非暴力沟通的知识回答时,deepseek也可以在他的训练知识中,提取这一块知识来回答
由此可以看出,当我们想要聚焦知识,或者有些知识不在大模型的初始训练知识内时,使用RAG,是一种实现目的的途径,将需要的信息整理到知识库内,通过知识库内的检索,让AI生成我们需要的答案
流程控制
仅仅让AI“知道”知识还不够,我们更需要它按照我们设定的专业流程来思考和工作,从而保证输出结果的高度一致性和专业性。这就是使用RAG的另一个强大能力——流程控制。
我们以一个非常实际的场景为例:一个自主研发的WMS(仓库管理系统)需要出海,所有界面、菜单、提示的文本都需要翻译成英文。
如果单纯靠人或直接让大模型翻译,会面临很多问题:
- 不统一:不同的人对同一个词可能有不同的翻译。比如,“库位”有人译成
Location
,有人译成Storage Location
,甚至可能是Bin
。 - 不专业:某些术语在物流行业有固定叫法。比如,“波次拣货”翻译成
Wave Picking
是专业术语,而按字面翻译成Batch Order Picking
就显得很不专业。 - 风格不一:对于大小写(是
Order
还是order
)、动词名词形式(是Confirm
还是Confirmation
)没有统一规范。
直接提问大模型:“请将‘入库订单’翻译成英文”,你可能会得到各种答案,因为它没有上下文。
而通过RAG,我们可以构建一个专业的翻译工作流,让AI像一支训练有素的本地化团队一样工作。
整体思路如下
- 构建知识库:我们创建三个核心知识库。
- 翻译规范库:存放强制性的翻译规则。例如:“‘货品’统一译为
Item
,首字母大写”、“所有状态动词统一使用现在分词形式,如‘盘点中’译为Counting...
”、“‘库位’统一使用Bin
而非Location
”。 - 历史翻译库:存放已经审核通过的现有翻译键值对,作为最重要的参考。例如:
{“入库订单”: “Inbound Order”, “出库订单”: “Outbound Order”}
。 - 行业术语库:存放物流行业的通用英文术语标准,用于翻译新词或验证专业性。
- 设计控制流程:当接到一个翻译请求(例如:翻译“待上架货品”)时,AI不会直接回答,而是严格按照以下流程执行:
- 第一步:检索
-
首先,去 翻译规范库 检索是否有关于“货品”、“待”等字的强制规则。
-
然后,去 历史翻译库 精确检索“待上架货品”是否有现成翻译。如果没有,则检索类似结构,如“待收货”、“待入库”的翻译是什么。
-
最后,去 行业术语库 检索“上架”的标准专业术语是什么(通常是
Putaway
或Storing
)。
- 第二步:推理与生成
- AI会综合所有检索到的信息进行推理:“历史库中‘货品’规定译为 Item,‘待’字前缀历史中常用 Pending(如‘待收货’是 Pending Receipt)。行业库中‘上架’是 Putaway。没有强制规则冲突。”
- 最终,它生成的翻译是:Pending Putaway Item。这个结果既符合内部规范,又保持了历史统一性,还具备了行业专业性。
另一个例子:翻译一个全新的词“库存水位预警”。
- 在历史库和规范库中都找不到直接答案。
- AI流程会先在行业库中检索“库存水位”和“预警”的标准说法,可能会找到
Inventory Level
和Alert
。 - 然后它会参考历史翻译中“预警”是放在前面还是后面(例如“温度预警”是译作
Temperature Alert
)。 - 最终组合出符合公司习惯和专业性的
Inventory Level Alert
。
通过这样的流程控制,我们不再是简单地向AI提问,而是命令它执行一个复杂的、多步骤的决策程序。这确保了即使负责翻译的人员不断变动,AI也能作为一个永不离职、严格遵循SOP(标准作业程序)的专家,输出稳定、可靠、高质量的翻译结果。
总结
总而言之,RAG 的出现并非是为了替代像 DeepSeek 这样的大模型,而是对其能力的一种关键增强。
选择直接提问大模型还是使用RAG,本质上是选择“开放探索”与“精准执行”两种不同的模式。如果任务目标不是获取灵感,而是要求基于特定知识做出准确、可靠回答时,RAG就从一个可选项变为了必选项。它可以让AI从“通用对话”走向“专业赋能”的关键一步
普通人如何抓住AI大模型的风口?
领取方式在文末
为什么要学习大模型?
目前AI大模型的技术岗位与能力培养随着人工智能技术的迅速发展和应用 , 大模型作为其中的重要组成部分 , 正逐渐成为推动人工智能发展的重要引擎 。大模型以其强大的数据处理和模式识别能力, 广泛应用于自然语言处理 、计算机视觉 、 智能推荐等领域 ,为各行各业带来了革命性的改变和机遇 。
目前,开源人工智能大模型已应用于医疗、政务、法律、汽车、娱乐、金融、互联网、教育、制造业、企业服务等多个场景,其中,应用于金融、企业服务、制造业和法律领域的大模型在本次调研中占比超过 30%。
随着AI大模型技术的迅速发展,相关岗位的需求也日益增加。大模型产业链催生了一批高薪新职业:
人工智能大潮已来,不加入就可能被淘汰。如果你是技术人,尤其是互联网从业者,现在就开始学习AI大模型技术,真的是给你的人生一个重要建议!
最后
只要你真心想学习AI大模型技术,这份精心整理的学习资料我愿意无偿分享给你,但是想学技术去乱搞的人别来找我!
在当前这个人工智能高速发展的时代,AI大模型正在深刻改变各行各业。我国对高水平AI人才的需求也日益增长,真正懂技术、能落地的人才依旧紧缺。我也希望通过这份资料,能够帮助更多有志于AI领域的朋友入门并深入学习。
真诚无偿分享!!!
vx扫描下方二维码即可
加上后会一个个给大家发
大模型全套学习资料展示
自我们与MoPaaS魔泊云合作以来,我们不断打磨课程体系与技术内容,在细节上精益求精,同时在技术层面也新增了许多前沿且实用的内容,力求为大家带来更系统、更实战、更落地的大模型学习体验。
希望这份系统、实用的大模型学习路径,能够帮助你从零入门,进阶到实战,真正掌握AI时代的核心技能!
01 教学内容
-
从零到精通完整闭环:【基础理论 →RAG开发 → Agent设计 → 模型微调与私有化部署调→热门技术】5大模块,内容比传统教材更贴近企业实战!
-
大量真实项目案例: 带你亲自上手搞数据清洗、模型调优这些硬核操作,把课本知识变成真本事!
02适学人群
应届毕业生: 无工作经验但想要系统学习AI大模型技术,期待通过实战项目掌握核心技术。
零基础转型: 非技术背景但关注AI应用场景,计划通过低代码工具实现“AI+行业”跨界。
业务赋能突破瓶颈: 传统开发者(Java/前端等)学习Transformer架构与LangChain框架,向AI全栈工程师转型。
vx扫描下方二维码即可
本教程比较珍贵,仅限大家自行学习,不要传播!更严禁商用!
03 入门到进阶学习路线图
大模型学习路线图,整体分为5个大的阶段:
04 视频和书籍PDF合集
从0到掌握主流大模型技术视频教程(涵盖模型训练、微调、RAG、LangChain、Agent开发等实战方向)
新手必备的大模型学习PDF书单来了!全是硬核知识,帮你少走弯路(不吹牛,真有用)
05 行业报告+白皮书合集
收集70+报告与白皮书,了解行业最新动态!
06 90+份面试题/经验
AI大模型岗位面试经验总结(谁学技术不是为了赚$呢,找个好的岗位很重要)
07 deepseek部署包+技巧大全
由于篇幅有限
只展示部分资料
并且还在持续更新中…
真诚无偿分享!!!
vx扫描下方二维码即可
加上后会一个个给大家发
更多推荐
所有评论(0)