RAG知识库搭建大揭秘：原来这么简单，还能这么有趣！

下面就可以验证了，我上传的文本中写了很简单的一句话，“openclaw是一个2026年很火的一个agent，他可以自己执行任务”，本身模型是23年的模型，他并不知道23年之后的事情，所以我问他“openclaw是什么”的时候，他本身是不知道如何回答的。LLM节点：上下文，选择【知识检索】的result，如果是通过模板生成的应用，prompt中有一些尽量隐藏他从上下文中获取的信息，将这句话删掉，否

小田学Python

339人浏览 · 2026-03-13 19:54:10

小田学Python · 2026-03-13 19:54:10 发布

RAG ：检索增强生成，检索 + 召回 + 提示词 + LLM 回答，就是给 AI 配了一本可查的书，不让它凭记忆胡说八道。

今天我们就通过一个案例来体验一下RAG是怎么工作的。

前置条件

前置依赖：本地dify+ollama LLM模型已搭建完成，具体参考Dify+Ollama模型搭建攻略：本地环境实战指南

本地部署embedding模型

# 拉取 nomic-embed-text 轻量模型（首次运行自动下载） 
ollama run nomic-embed-text
# 检查模型是否存在
ollama list

embedding是什么呢？他其实就是把一段文字，变成一个多维向量，也就是一串数字。向量检索就是通过把两句话分别进行向量量后去比较他们的相似度，我们现在部署的 nomic-embed-test 就是把文字转换成向量的工具，在查询时，把问题也转换为向量，去向量库中找相似的内容。

dify配置模型

我的dify版本是1.13，模型配置位于右上角：点击头像 -> 设置 -> 模型供应商 -> ollama(如未安装需要先点击安装) -> 添加模型，关键配置如下：

模型名称：即ollama list查出的你新下载的模型

模型类型：“Text Embedding”

基础URL：固定配置“ http://host.docker.internal:11434 ”（基于上一篇docker部署dify+本地ollama模型场景）

知识库配置

知识库中点击创建知识库，进入后添加文件，他会有个解析的过程，你可以手动编辑一段AI不知道的文本，用于后续测试。

设置中，索引模式选择【高质量】，Embedding 模型选择刚才添加的模型，最下方保存。

配置应用

应用可以复用上次的知识库聊天机器人（或直接通过模板创建【知识库+聊天机器人】）。

知识检索节点：知识库位置添加刚刚创建好的知识库

LLM节点：上下文，选择【知识检索】的result，如果是通过模板生成的应用，prompt中有一些尽量隐藏他从上下文中获取的信息，将这句话删掉，否则可能由于你的知识库中的知识，大模型自己不了解，而选择按他自己的意思来猜测，导致结果不准确。

效果验证

下面就可以验证了，我上传的文本中写了很简单的一句话，“openclaw是一个2026年很火的一个agent，他可以自己执行任务”，本身模型是23年的模型，他并不知道23年之后的事情，所以我问他“openclaw是什么”的时候，他本身是不知道如何回答的。

下面是他回答的结果，可以看到，在LLM节点前，他从知识库中检索到我上传的这句话，并进行解读。

怎么样，真正上手是不是发现他并没有那么难。如果遇到什么卡点欢迎评论区留言，我们一起探讨，如果你搭建成功了也欢迎评论区show一下。后续我会持续输出各种实战案例，敬请期待！

往期推荐

Python数据分析入门：从零开始玩转数据

大模型到底怎么思考？一篇看懂 Prompt、思维链、思维树

足球运动员的数据分析实战(python)

龙虾开发者社区

小龙虾开发者社区是 CSDN 旗下专注 OpenClaw 生态的官方阵地，聚焦技能开发、插件实践与部署教程，为开发者提供可直接落地的方案、工具与交流平台，助力高效构建与落地 AI 应用

更多推荐

QClaw体验：微信里的本地AI助手，让智能触手可及

龙虾开发者社区

VibeVoice Pro流式TTS效果展示：300ms低延迟真实音频生成作品集

本文介绍了如何在星图GPU平台自动化部署VibeVoice Pro：零延迟流式音频引擎镜像，实现300ms低延迟的实时语音生成。该技术特别适用于智能助手对话场景，能够提供自然流畅的语音交互体验，显著提升用户满意度。

龙虾开发者社区

WorkBuddy使用心得：腾讯版“免部署小龙虾“的办公新体验

龙虾开发者社区

所有评论(0)

查看更多评论

小田学Python

@Yudanqu

已为社区贡献4条内容