RAGFlow 本地部署全攻略：10 分钟构建专业级 AI 知识库，大模型从入门到精通，收藏这篇就够了

RAGFlow 的本地化部署不仅适用于个人学习，还可作为企业级知识管理解决方案，实现团队协作与数据安全

AI-智能

1015人浏览 · 2025-09-08 16:34:30

AI-智能 · 2025-09-08 16:34:30 发布

RAGFlow 作为一款开源检索增强生成引擎，凭借其深度文档理解能力和灵活配置性，已成为企业及个人构建 AI 知识库的热门工具。本文将手把手教你完成 RAGFlow 的本地部署，解决端口冲突、镜像拉取慢等常见问题，助你快速搭建私有化 AI 知识库

一、部署前准备

硬件要求

CPU：4 核及以上（推荐 x86 架构）
内存：≥16GB
磁盘空间：≥50GB（镜像文件约 9GB）

软件要求

Docker

：≥24.0.0
Docker Compose

：≥2.26.1
操作系统

：Linux/Windows/macOS（需支持 Docker）

系统配置优化

调整 Elasticsearch 内存映射限制（避免服务崩溃）：

sudo sysctl -w vm.max_map_count=262144  
# 永久生效需添加至 /etc/sysctl.conf

确保 Docker 已启动且权限配置正确

二、项目下载与配置

下载 RAGFlow 源码

Git 克隆（推荐）：

git clone https://github.com/infiniflow/ragflow.git

手动下载：

Fork 项目至个人 GitHub 仓库，点击 Code → Download ZIP，解压至本地目录

关键配置修改

启用嵌入模型：
编辑 docker/.env 文件，取消注释 ragflow_image=infiniflow/ragflow:v0.17.2（默认镜像无嵌入模型），注释 slim 版本行
```
# 原配置：  
# ragflow_image=infiniflow/ragflow:v0.17.2-slim  
# 修改后：  
ragflow_image=infiniflow/ragflow:v0.17.2  
```
国内镜像加速

（解决拉取慢问题）：
替换镜像源为阿里云地址：

ragflow_image=registry.cn-hangzhou.aliyuncs.com/infiniflow/ragflow:v0.17.2

HuggingFace 镜像

：
取消注释 hf_endpoint=https://hf-mirror.com，解决国内访问限制

端口调整（避免与 Dify 等工具冲突）：

修改 docker-compose.yml 中端口映射为 8080:80 和 8443:443

三、启动 RAGFlow 服务

进入项目目录
```
cd ragflow/docker  
```

2.执行启动命令

CPU 版本

（无独立显卡用户）：

docker compose -f docker-compose.yml up -d

GPU 版本

（需 NVIDIA 显卡驱动）：

docker compose -f docker-compose-gpu.yml up -d

启动后可通过 docker logs -f ragflow-server 查看状态

3.访问服务

浏览器输入 http://127.0.0.1:8080 或 http://<服务器IP>:8080 进入管理界面

四、模型与知识库配置

绑定大语言模型
- 登录后点击右上角「模型提供商」，填写 OpenAI、DeepSeek 等 API 密钥
- 推荐配置
  
  ：
- 嵌入模型选择 BGE（专为中文优化）
- 生成模型可选 GPT-4、文心一言等。
创建知识库

点击「知识库 → 新建」，上传 PDF、Word、Excel 等文件（支持多格式混合）
根据文档类型选择分块策略（如长文本分段、表格解析）。

五、常见问题与优化

部署失败排查

端口冲突

：检查 80/443 端口占用情况，或修改为其他端口
镜像拉取失败

：切换阿里云镜像源或配置 Docker 全局代理

性能优化

GPU 加速：启用 docker-compose-gpu.yml 提升嵌入模型速度。
知识库分片：大型文档建议拆分为多个子库，减少单次检索压力

六、结语

通过以上步骤，你可快速搭建一个支持多模态文档、高可配置的 AI 知识库。RAGFlow 的本地化部署不仅适用于个人学习，还可作为企业级知识管理解决方案，实现团队协作与数据安全

大模型算是目前当之无愧最火的一个方向了，算是新时代的风口！有小伙伴觉得，作为新领域、新方向人才需求必然相当大，与之相应的人才缺乏、人才竞争自然也会更少，那转行去做大模型是不是一个更好的选择呢？是不是更好就业呢？是不是就暂时能抵抗35岁中年危机呢？

答案当然是这样，大模型必然是新风口！

那如何学习大模型？

由于新岗位的生产效率，要优于被取代岗位的生产效率，所以实际上整个社会的生产效率是提升的。但是具体到个人，只能说是：

最先掌握AI的人，将会比较晚掌握AI的人有竞争优势。
这句话，放在计算机、互联网、移动互联网的开局时期，都是一样的道理。

但现在很多想入行大模型的人苦于现在网上的大模型老课程老教材，学也不是不学也不是，基于此我用做产品的心态来打磨这份大模型教程，深挖痛点并持续修改了近100余次后，终于把整个AI大模型的学习路线完善出来！

在这里插入图片描述

在这个版本当中：

您只需要听我讲，跟着我做即可，为了让学习的道路变得更简单，这份大模型路线+学习教程已经给大家整理并打包分享出来, 😝有需要的小伙伴，可以 扫描下方二维码领取🆓↓↓↓

👉CSDN大礼包🎁：全网最全《LLM大模型学习资源包》免费分享（安全咨料，放心领取）👈

一、大模型经典书籍（免费分享）

AI大模型已经成为了当今科技领域的一大热点，那以下这些大模型书籍就是非常不错的学习资源。

在这里插入图片描述

二、640套大模型报告（免费分享）

这套包含640份报告的合集，涵盖了大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师，还是对AI大模型感兴趣的爱好者，这套报告合集都将为您提供宝贵的信息和启示。(几乎涵盖所有行业)
在这里插入图片描述

三、大模型系列视频教程（免费分享）

在这里插入图片描述

四、2025最新大模型学习路线（免费分享）

我们把学习路线分成L1到L4四个阶段，一步步带你从入门到进阶，从理论到实战。

L1阶段:启航篇丨极速破界AI新时代

L1阶段：了解大模型的基础知识，以及大模型在各个行业的应用和分析，学习理解大模型的核心原理、关键技术以及大模型应用场景。

L2阶段：攻坚篇丨RAG开发实战工坊

L2阶段：AI大模型RAG应用开发工程，主要学习RAG检索增强生成：包括Naive RAG、Advanced-RAG以及RAG性能评估，还有GraphRAG在内的多个RAG热门项目的分析。

L3阶段：跃迁篇丨Agent智能体架构设计

L3阶段：大模型Agent应用架构进阶实现，主要学习LangChain、 LIamaIndex框架，也会学习到AutoGPT、 MetaGPT等多Agent系统，打造Agent智能体。

L4阶段：精进篇丨模型微调与私有化部署

L4阶段：大模型的微调和私有化部署，更加深入的探讨Transformer架构，学习大模型的微调技术，利用DeepSpeed、Lamam Factory等工具快速进行模型微调，并通过Ollama、vLLM等推理部署框架，实现模型的快速部署。

L5阶段：专题集丨特训篇【录播课】

全套的AI大模型学习资源已经整理打包，有需要的小伙伴可以微信扫描下方二维码，免费领取

👉CSDN大礼包🎁：全网最全《LLM大模型学习资源包》免费分享（安全资料，放心领取）👈

深圳城市开发者社区

一座年轻的奋斗人之城，一个温馨的开发者之家。在这里，代码改变人生，开发创造未来！

更多推荐

CNCC2025回顾｜网易伏羲主题分论坛圆满落幕，产学研共探智能体技术跃迁路径

第22届中国计算机大会（CNCC2025）在哈尔滨召开，主题为"数智赋能、无限可能"。网易伏羲承办分论坛，聚焦游戏AI、具身智能等方向，邀请多所高校专家分享研究成果，包括去中心化多智能体学习、数字人三维建模等。会上举行课题授牌仪式并发布二期研究方向，旨在促进产学研合作，推动AI技术产业化。论坛展现智能体技术从理论到应用的突破，为数字经济发展提供新动能。

深圳城市开发者社区

数据库卡成PPT？MongoDB的explain()让你“复明“！——从索引卡顿到秒级响应的实战秘籍

深圳城市开发者社区

【GitHub项目推荐--Agent OS：AI驱动的智能软件开发系统】⭐

Agent OS 是一个革命性的系统，旨在通过AI代理更好地规划和执行软件开发任务。它将AI编码代理从"困惑的实习生"转变为"高效开发者"，通过结构化的工作流程来捕获您的标准、技术栈和代码库的独特细节，让AI代理能够一次性交付高质量代码。项目背景：AI开发趋势：AI辅助开发成为主流质量挑战：AI生成代码质量不稳定效率需求：提升开发效率需求标准化需求：开发流程标准化团队协作