大模型应用开发初探 : 快速直观感受RAG，大模型入门到精通，收藏这篇就足够了！

这一篇，我们来快速了解下RAG（检索增强生成）并通过一个简单的DEMO来直观感受一下它的作用。

程序学到昏

580人浏览 · 2025-09-08 10:16:29

程序学到昏 · 2025-09-08 10:16:29 发布

这一篇，我们来快速了解下RAG（检索增强生成）并通过一个简单的DEMO来直观感受一下它的作用。

RAG是什么？

检索增强生成（Retrieval Augmented Generation），简称 RAG，它是根据用户输入的提示词，通过自有垂域数据库检索相关信息，然后合并成为一个新的“完备的“提示词，最后再给大模型生成较为准确的回答。

例如，假设你正在构建问答聊天机器人，以帮助员工回答有关公司专有文档的问题。如果没有专门的培训，独立的 LLM 将无法准确回答有关这些文档的内容的问题，因为这些 LLM 都是基于互联网上公开的数据训练的。LLM 可能会因为缺乏信息而拒绝回答，或者更糟的是，它可能会生成不正确的响应。

为了解决这个问题，RAG 首先根据用户的查询从公司文档检索相关信息，然后将检索到的信息作为额外的上下文提供给 LLM。这样，LLM 就可以根据在相关文档中找到的特定详细信息生成更准确的响应。从本质上讲，RAG 使 LLM 能够“咨询”检索到的信息来表述其答案。

一般的RAG工作流程如下图所示，它实现了 非参数事实知识和逻辑推理能力的解耦或分离，这些事实知识存储在外部知识库中独立管理和更新，确保LLM能够访问到就行。

综上所述，RAG其实类似于大学期末的开卷考试，反正知识点都在书里，你平时都没学过，得先找一找，找到了就把相关答案写在试卷上，考完了还是忘得一干二净，但是你的目标达到了：考试及格60分万岁！对于LLM来说，它完成了任务，给你了一个至少可以有60分的回答。下面总结下：

检索（Retrieve）：根据用户提示词从知识库中获取相关知识上下文。
增强（Augment）：将用户的原始提示词和获取到的知识进行合并，形成一个新的提示词。
生成（Generate）：将增强后的新提示词发给LLM进行输出。

直观感受RAG

这里我们就不深究RAG的更多细节内容了，先来通过一个DEMO直观感受下RAG到底有什么作用。至于那些更多的细节内容，留到后续学习实践后，再总结分享。

这仍然是一个WindowsForm的DEMO应用，界面如下：

（1）在没有使用RAG时的查询

（2）使用RAG：导入内部知识

（3）使用RAG：检索增强查询

可以看到，基于导入的内部知识，LLM能够基于RAG获得这些知识片段，然后结合用户的问题和知识片段来生成较为准确的答案。

DEMO要点

（1）配置文件

DEMO中LLM使用的是Qwen2-7B-Instruct的模型，Embedding使用的是bge-m3模型，具体的配置如下：

{
  "OpenAI": {
    "API_PROVIDER": "SiliconCloud",
    "API_CHATTING_MODEL": "Qwen/Qwen2-7B-Instruct",
    "API_EMBEDDING_MODEL": "BAAI/bge-m3",
    "API_BASE_URL": "https://api.siliconflow.cn",
    "API_KEY": "**********************" // Update this value to yours
  },
  "TextChunker": {
    "LinesToken": 100,
    "ParagraphsToken": 1000
  }
}

（2）使用组件

使用到的组件包主要有两个：

Microsoft.SemanticKernel 1.19.0
Microsoft.SemanticKernel.Connectors.OpenAI 1.19.0
Microsoft.SemanticKernel.Connectors.Sqlite 1.19.0-alpha

可以看到这里使用的是一个本地数据Sqlilte来作为向量数据库存储，因为我们这个仅仅是个快速的DEMO，实际中可能会考虑选择更为适合的DB。需要注意的是，这里Sqlite这个包是个预览版，你在Nuget管理器中需要注意下勾选包含预览版才能搜索得到。

也正因为这个预览版，很多用法都有警告提示，所以最好在代码中加上下面这些将其禁用掉：

#pragma warning disable SKEXP0050
#pragma warning disable SKEXP0001
#pragma warning disable SKEXP0020
#pragma warning disable SKEXP0010
public partial class ChatForm : Form
{
    ......
}

（3）Embedding

private void btnEmbedding_Click(object sender, EventArgs e)
{
    var query = new QueryModel(tbxIndex.Text, tbxPrompt.Text);
    _textMemory = this.GetTextMemory().GetAwaiter().GetResult();
    var lines = TextChunker.SplitPlainTextLines(query.Text, _textChunkerLinesToken);
    var paragraphs = TextChunker.SplitPlainTextParagraphs(lines, _textChunkerParagraphsToken);

    foreach (var para in paragraphs)
    {
        Task.Run(() =>
        {
            ShowProcessMessage("AI is embedding your content now...");
            _textMemory.SaveInformationAsync(
                query.Index,
                id: Guid.NewGuid().ToString(),
                text: para)
            .GetAwaiter()
            .GetResult();
            ShowProcessMessage("Embedding success!");
            MessageBox.Show("Embedding success!", "Information", MessageBoxButtons.OK, MessageBoxIcon.Information);
        });
    }
}

private async Task<ISemanticTextMemory> GetTextMemory()
{
    var memoryBuilder = new MemoryBuilder();
    var embeddingApiClient = new HttpClient(new OpenAiHttpHandler(_embeddingApiConfiguration.Provider, _embeddingApiConfiguration.EndPoint));
    memoryBuilder.WithOpenAITextEmbeddingGeneration(
        _embeddingApiConfiguration.ModelId,
        _embeddingApiConfiguration.ApiKey,
        httpClient: embeddingApiClient);
    var memoryStore = await SqliteMemoryStore.ConnectAsync("memstore.db");
    memoryBuilder.WithMemoryStore(memoryStore);
    var textMemory = memoryBuilder.Build();

    return textMemory;
}

在Click事件中，调用GetTextMemory方法进行真正的Embedding操作，然后进行数据持久化到本地的Sqlite数据库。在GetTextMemory这个方法中，实现了调用Embedding模型API进行词嵌入。

数据写入Sqlite后打开表后的效果如下图所示。至于这个collection字段，是对应界面中的Index字段，这里我们暂时不用管它。

（4）Generation

private void btnGetRagResponse_Click(object sender, EventArgs e)
{
    if (_textMemory == null)
        _textMemory = this.GetTextMemory().GetAwaiter().GetResult();

    var query = new QueryModel(tbxIndex.Text, tbxPrompt.Text);
    var memoryResults = _textMemory.SearchAsync(query.Index, query.Text, limit: 3, minRelevanceScore: 0.3);

    Task.Run(() =>
    {
        var existingKnowledge = this.BuildPromptInformation(memoryResults).GetAwaiter().GetResult();
        var integratedPrompt = @"
                            获取到的相关信息：[{0}]。
                            根据获取到的信息回答问题：[{1}]。
                            如果没有获取到相关信息，请直接回答 Sorry不知道。
                        ";
        ShowProcessMessage("AI is handling your request now...");
        var response = _kernel.InvokePromptAsync(string.Format(integratedPrompt, existingKnowledge, query.Text))
            .GetAwaiter()
            .GetResult();
        UpdateResponseContent(response.ToString());
        ShowProcessMessage("AI Response:");
    });
}

private async Task<string> BuildPromptInformation(IAsyncEnumerable<MemoryQueryResult> memoryResults)
{
    var information = string.Empty;
    await foreach (MemoryQueryResult memoryResult in memoryResults)
    {
        information += memoryResult.Metadata.Text;
    }

    return information;
}

在Click事件中，将用户的原始提示词和从知识库中获取的知识片段通过一个提示词模板组成另一个增强版的提示词，最后将这个新的提示词发给LLM进行处理回答。

小结

本文简单介绍了一下RAG（检索增强生成）的基本概念和工作流程，然后通过一个简单的DEMO快速直观感受了一下RAG的作用。后续，我们会持续关注RAG的更多细节内容和落地实践。

参考内容

mingupupu大佬的文章：https://www.cnblogs.com/mingupupu/p/18367726

示例源码

GitHub：https://github.com/Coder-EdisonZhou/EDT.Agent.Demos

我们该怎样系统的去转行学习大模型？

很多想入行大模型的人苦于现在网上的大模型老课程老教材，学也不是不学也不是，基于此，我用做产品的心态来打磨这份大模型教程，深挖痛点并持续修改了近100余次后，终于把整个AI大模型的学习门槛，降到了最低！

您只需要听我讲，跟着我做即可，为了让学习的道路变得更简单，这份大模型教程已经给大家整理并打包，现在将这份 LLM大模型资料 分享出来： 😝有需要的小伙伴，可以 扫描下方二维码领取🆓↓↓↓

一、大模型经典书籍（免费分享）

AI大模型已经成为了当今科技领域的一大热点，那以下这些大模型书籍就是非常不错的学习资源。

二、640套大模型报告（免费分享）

这套包含640份报告的合集，涵盖了大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师，还是对AI大模型感兴趣的爱好者，这套报告合集都将为您提供宝贵的信息和启示。(几乎涵盖所有行业)
在这里插入图片描述

三、大模型系列视频教程（免费分享）

在这里插入图片描述

四、2025最新大模型学习路线（免费分享）

我们把学习路线分成L1到L4四个阶段，一步步带你从入门到进阶，从理论到实战。

L1阶段:启航篇丨极速破界AI新时代

L1阶段：我们会去了解大模型的基础知识，以及大模型在各个行业的应用和分析；学习理解大模型的核心原理、关键技术以及大模型应用场景。

L2阶段：攻坚篇丨RAG开发实战工坊

L2阶段是我们的AI大模型RAG应用开发工程，我们会去学习RAG检索增强生成：包括Naive RAG、Advanced-RAG以及RAG性能评估，还有GraphRAG在内的多个RAG热门项目的分析。

L3阶段：跃迁篇丨Agent智能体架构设计

L3阶段：大模型Agent应用架构进阶实现，我们会去学习LangChain、 LIamaIndex框架，也会学习到AutoGPT、 MetaGPT等多Agent系统，打造我们自己的Agent智能体。

L4阶段：精进篇丨模型微调与私有化部署

L4阶段：大模型的微调和私有化部署，我们会更加深入的探讨Transformer架构，学习大模型的微调技术，利用DeepSpeed、Lamam Factory等工具快速进行模型微调。

L5阶段：专题集丨特训篇【录播课】

全套的AI大模型学习资源已经整理打包，有需要的小伙伴可以微信扫描下方二维码，免费领取

武汉城市开发者社区

为武汉地区的开发者提供学习、交流和合作的平台。社区聚集了众多技术爱好者和专业人士，涵盖了多个领域，包括人工智能、大数据、云计算、区块链等。社区定期举办技术分享、培训和活动，为开发者提供更多的学习和交流机会。

更多推荐

【保姆级教程】构建企业级AI智能客服：大模型应用实践与技术方案详解！

武汉城市开发者社区

Python模块化需求分析与设计框架

多智能体协作的荣格八维分析器需要结合心理学理论（荣格八维功能）和分布式计算技术。核心模块包括：用户输入处理、智能体任务分配、八维算法计算、结果整合与可视化。根据用户输入代码要求，设计一个模块化、可扩展的需求分析与设计框架。以下示例采用Python语言，包含需求解析、功能拆分、设计模式应用等核心逻辑。VB6或VB.NET均可作为开发语言，推荐VB.NET（Framework 4.8）以获得现代功能支

武汉城市开发者社区

鞋服品牌如何用企业微信AI SCRM提效私域运营：单月GMV破6000万的实战拆解

他们用了微盛AI·企微管家推出的企业微信AI聊天agent，是智能回复能智能识别微信客户问的问题，并自动推荐包含穿搭指南、新品图能内容，导购跟客户1V1聊天时，直接从企业微信侧边栏调出来就能发，不用自己找图、写文案；比如会员系统里的客户，系统会自动发一条带导购企业微信二维码的消息，客户加上后，导购能直接看到客户的历史订单：比如买过什么款式、花了多少钱、上次什么时候买的。传统CRM是个单独的系统，客