从0到1手把手教你实现RAG系统：代码+原理详解，轻松玩转知识库问答！

RAG（Retrieval-Augmented Generation）结合了信息检索和文本生成的优势。其核心思想是：在回答问题前，先从知识库中检索相关信息，然后将这些信息作为上下文提供给大模型，从而生成更准确、更专业的回答。传统大模型的局限性：知识截止日期固定，无法获取最新信息对专业领域知识掌握有限容易产生"幻觉"，编造不存在的信息RAG的优势：实时获取最新信息支持专业领域知识库提供答案来源，可验

Lucas55555555

713人浏览 · 2025-11-09 13:28:34

Lucas55555555 · 2025-11-09 13:28:34 发布

在AI技术飞速发展的今天，大模型虽然强大，但存在知识滞后、专业领域理解不足的问题。今天我要分享的RAG（检索增强生成）技术，正是解决这一痛点的利器！本文将手把手带你从零实现一个完整的RAG系统，包含可运行的代码和原理解析。

一、什么是RAG？为什么它如此重要？

RAG（Retrieval-Augmented Generation）结合了信息检索和文本生成的优势。其核心思想是：在回答问题前，先从知识库中检索相关信息，然后将这些信息作为上下文提供给大模型，从而生成更准确、更专业的回答。

传统大模型的局限性：

知识截止日期固定，无法获取最新信息
对专业领域知识掌握有限
容易产生"幻觉"，编造不存在的信息

RAG的优势：

实时获取最新信息
支持专业领域知识库
提供答案来源，可验证性强

二、RAG系统架构全解析

一个完整的RAG系统包含以下核心模块：

知识库预处理 → 向量化存储 → 问题检索 → 增强生成

下面我们分步骤实现每个模块。

三、手把手代码实现

1. 环境准备和依赖安装

# requirements.txt
pip install langchain openai chromadb sentence-transformers pypdf2

2. 文档加载和预处理模块

import os
from langchain.document_loaders import PyPDFLoader, TextLoader
from langchain.text_splitter import RecursiveCharacterTextSplitter

class DocumentProcessor:
    def __init__(self, chunk_size=500, chunk_overlap=50):
        self.text_splitter = RecursiveCharacterTextSplitter(
            chunk_size=chunk_size,
            chunk_overlap=chunk_overlap
        )
    
    def load_documents(self, file_path):
        """加载文档并根据文件类型选择加载器"""
        if file_path.endswith('.pdf'):
            loader = PyPDFLoader(file_path)
        elif file_path.endswith('.txt'):
            loader = TextLoader(file_path, encoding='utf-8')
        else:
            raise ValueError("Unsupported file format")
        
        documents = loader.load()
        return self.split_documents(documents)
    
    def split_documents(self, documents):
        """将文档切分成小块"""
        return self.text_splitter.split_documents(documents)

# 使用示例
processor = DocumentProcessor()
documents = processor.load_documents("knowledge_base.pdf")
print(f"文档切分成 {len(documents)} 个块")import os
from langchain.document_loaders import PyPDFLoader, TextLoader
from langchain.text_splitter import RecursiveCharacterTextSplitter

class DocumentProcessor:
    def __init__(self, chunk_size=500, chunk_overlap=50):
        self.text_splitter = RecursiveCharacterTextSplitter(
            chunk_size=chunk_size,
            chunk_overlap=chunk_overlap
        )
    
    def load_documents(self, file_path):
        """加载文档并根据文件类型选择加载器"""
        if file_path.endswith('.pdf'):
            loader = PyPDFLoader(file_path)
        elif file_path.endswith('.txt'):
            loader = TextLoader(file_path, encoding='utf-8')
        else:
            raise ValueError("Unsupported file format")
        
        documents = loader.load()
        return self.split_documents(documents)
    
    def split_documents(self, documents):
        """将文档切分成小块"""
        return self.text_splitter.split_documents(documents)

# 使用示例
processor = DocumentProcessor()
documents = processor.load_documents("knowledge_base.pdf")
print(f"文档切分成 {len(documents)} 个块")

3. 向量化存储模块

import numpy as np
from sentence_transformers import SentenceTransformer
import chromadb

class VectorStore:
    def __init__(self, model_name='all-MiniLM-L6-v2'):
        self.model = SentenceTransformer(model_name)
        self.client = chromadb.Client()
        self.collection = self.client.create_collection("knowledge_base")
    
    def add_documents(self, documents):
        """将文档向量化并存储"""
        texts = [doc.page_content for doc in documents]
        embeddings = self.model.encode(texts)
        
        # 存储到向量数据库
        ids = [str(i) for i in range(len(texts))]
        self.collection.add(
            embeddings=embeddings.tolist(),
            documents=texts,
            ids=ids
        )
    
    def search(self, query, top_k=3):
        """检索相关文档"""
        query_embedding = self.model.encode([query]).tolist()
        results = self.collection.query(
            query_embeddings=query_embedding,
            n_results=top_k
        )
        return results['documents'][0]

# 初始化向量存储
vector_store = VectorStore()
vector_store.add_documents(documents)

4. 检索增强生成核心模块

from openai import OpenAI
import json

class RAGSystem:
    def __init__(self, vector_store, api_key):
        self.vector_store = vector_store
        self.client = OpenAI(api_key=api_key)
    
    def retrieve(self, query, top_k=3):
        """检索相关文档"""
        return self.vector_store.search(query, top_k)
    
    def generate_prompt(self, query, contexts):
        """构建增强的提示词"""
        context_str = "\n\n".join(contexts)
        
        prompt = f"""基于以下背景信息回答问题。如果信息不足，请如实告知。

背景信息：
{context_str}

问题：{query}

请根据背景信息提供准确、专业的回答："""
        return prompt
    
    def generate_answer(self, query, top_k=3):
        """生成答案"""
        # 检索相关文档
        contexts = self.retrieve(query, top_k)
        
        # 构建提示词
        prompt = self.generate_prompt(query, contexts)
        
        # 调用大模型生成答案
        response = self.client.chat.completions.create(
            model="gpt-3.5-turbo",
            messages=[
                {"role": "user", "content": prompt}
            ],
            temperature=0.3
        )
        
        return {
            "answer": response.choices[0].message.content,
            "sources": contexts
        }

# 初始化RAG系统
rag_system = RAGSystem(vector_store, "your-openai-api-key")

四、完整示例演示

def main():
    # 1. 处理知识库文档
    processor = DocumentProcessor()
    documents = processor.load_documents("ai_technology.pdf")
    
    # 2. 构建向量数据库
    vector_store = VectorStore()
    vector_store.add_documents(documents)
    
    # 3. 初始化RAG系统
    rag = RAGSystem(vector_store, "your-api-key")
    
    # 4. 问答演示
    questions = [
        "什么是机器学习？",
        "Transformer模型的主要创新点是什么？",
        "请解释注意力机制的原理"
    ]
    
    for question in questions:
        result = rag.generate_answer(question)
        print(f"问题：{question}")
        print(f"答案：{result['answer']}")
        print(f"来源文档数：{len(result['sources'])}")
        print("-" * 50)

if __name__ == "__main__":
    main()

五、高级优化技巧

1. 混合检索策略

class HybridRetriever:
    def __init__(self, vector_store, bm25_retriever):
        self.vector_retriever = vector_store
        self.bm25_retriever = bm25_retriever
    
    def search(self, query, top_k=3):
        # 向量检索
        vector_results = self.vector_retriever.search(query, top_k*2)
        # 关键词检索
        bm25_results = self.bm25_retriever.search(query, top_k*2)
        
        # 结果融合和去重
        combined = self.rrf_fusion([vector_results, bm25_results])
        return combined[:top_k]
    
    def rrf_fusion(self, results_list):
        """互逆排序融合算法"""
        # 实现略
        pass

2. 查询重写优化

def query_rewrite(original_query, conversation_history):
    """基于对话历史重写查询"""
    prompt = f"""
    根据对话历史优化当前查询，使其更利于检索相关文档。
    
    对话历史：{conversation_history}
    当前查询：{original_query}
    
    优化后的查询："""
    
    # 调用LLM进行查询重写
    rewritten = llm_complete(prompt)
    return rewritten

六、实际应用场景

企业知识库问答：内部文档、技术手册的智能查询
学术研究助手：论文库的智能检索和分析
客服系统：产品文档和FAQ的智能应答
个人学习助手：个人知识库的管理和查询

七、性能优化建议

分块策略优化：根据文档类型调整分块大小
多索引支持：对不同类型的知识建立专门索引
缓存机制：对常见查询结果进行缓存
异步处理：提高系统并发处理能力

总结

本文完整实现了RAG系统的核心功能，从文档处理到检索增强生成的整个流程。通过代码+原理的讲解方式，希望能帮助大家深入理解RAG技术。

关键要点：

RAG有效解决了大模型的知识局限性问题
向量检索的质量直接影响最终效果
提示词工程是提升生成质量的关键

进一步学习方向：

探索更先进的检索算法（如ColBERT、DPR）
研究多模态RAG系统
学习RAG系统的评估和优化方法

思考题：在你的专业领域，RAG技术可以解决哪些具体问题？欢迎在评论区分享你的想法！

如果觉得本文对你有帮助，欢迎点赞收藏🌟，我会继续分享更多AI实战技术！有任何问题也欢迎留言讨论～

合肥城市开发者社区

助力合肥开发者学习交流的技术社区，不定期举办线上线下活动，欢迎大家的加入

更多推荐

深入解读OpenClaw配置文件：一个现代化AI网关的全景洞察

合肥城市开发者社区

2026年3月13日AI热点：芯片大战、Agent爆发、安全争议

芯片竞争加剧：Nvidia 260亿投入开源，Meta 4款新芯片Agent时代来临：Nvidia开源平台、OpenAI追赶Claude CodeAI安全争议：Anthropic起诉国防部、青少年AI滥用问题应用层创新：Google全家桶AI化、亚马逊Alexa个性化本文由AI助手收集整理 | 来源：Hacker News, The Verge, WIRED, arXiv。