CSDN1515595030 个人主页

@CSDN1515595030

CSDN1515595030

2025-04-16 21:56:32 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

从0到1搭建企业级RAG系统

本文记录了从零开始搭建企业级RAG系统的环境准备阶段，重点介绍了Milvus向量数据库的部署过程。作者使用Windows11+WSL2 Ubuntu22.04的开发环境，详细说明了Docker安装、GPU支持配置以及国内镜像加速设置。文章提供了完整的Milvus部署指南，包括docker-compose配置、服务验证和Python客户端连接测试，并分享了项目目录结构设计的最佳实践。作为系列教程的第

#python

从0到1搭建企业级RAG系统（二）：整合 Redis、Prometheus 与 Grafana，打造完整基础设施

本文介绍了在企业级RAG系统中整合Redis缓存、Prometheus监控和Grafana仪表盘的全过程。通过修改docker-compose.yml文件追加三个新服务，配置Prometheus抓取指标，并详细记录了网络冲突、权限拒绝等典型问题的排查方法。文章提供了WSL2环境下的解决方案，包括清理冲突网络、设置目录权限等实用技巧，最终实现了6个服务同时运行的稳定状态。同时给出了Milvus数据库

#redis #prometheus #grafana

从0到1搭建企业级RAG系统（三）：文档向量化、AI爬虫实战与知识库规模化

本文详细介绍了如何从零构建一个企业级RAG系统的知识库模块。主要内容包括：1）设计Milvus向量数据库Schema并实现连接管理；2）开发支持多格式的文档分块模块；3）构建数据灌入流程，将14篇高质量AI领域文章处理为718个文本块；4）实现混合检索（向量+关键词）和Reranker精排模块，通过实验验证Reranker能有效纠正检索偏差；5）完成工程规范化，包括依赖管理、目录结构和问题排查记录

#python #RAG

从0到1搭建企业级RAG系统（四）：混合检索、Reranker精排、双层缓存与端到端问答实战

本文详细介绍了企业级RAG系统的核心模块实现，重点解决了从知识库到智能问答的全链路优化问题。系统采用混合检索（向量+BM25+RRF融合）提升召回效果，引入Reranker精排模块提高答案质量，并通过双层缓存架构（L1精确缓存+L2语义缓存）将响应时间从20秒降至毫秒级。文章不仅提供了代码实现细节和踩坑经验，还分析了当前系统的局限性，并规划了查询改写、动态阈值等优化方向，为构建生产级RAG系统提供

#RAG #python #https

从0到1搭建企业级RAG系统（六）：性能突围——从0.50到0.80的召回率翻身仗

《从0.50到0.80：LiteRAG召回率优化实战》记录了将RAG系统核心指标全面优化的完整过程。文章首先通过RAGAS评估框架发现初始系统存在高精度低召回问题（ContextRecall仅0.50），随后通过代码审计发现4个P0级缺陷，包括查询改写禁用、缓存设计缺陷等。核心优化包括：升级多语言Embedding模型、强化专业术语分词、引入加权RRF融合算法，最终将召回率提升60%至0.80，精

#人工智能 #深度学习

从0到1搭建企业级RAG系统（五）：多轮对话、查询改写与智能前端——迈向生产级交互

本文介绍了如何将LiteRAG系统从单轮问答升级为具备多轮对话能力、记忆功能和友好界面的智能助手。主要改进包括：1) 实现查询改写功能处理指代问题；2) 基于Redis设计多轮对话会话管理；3) 部署本地LLM解决云端API不稳定问题；4) 重构Gradio界面支持多会话管理。文章详细记录了技术方案选择、实现细节和问题排查过程，特别分享了持续10小时的缓存污染问题排查经历，最终使系统在忠实度、相关

#前端 #交互

【大模型微调实战】第1期：在6GB笔记本上跑通存储领域CPT全记录

本文记录了一位开发者使用RTX3060笔记本（6GB显存）微调Qwen3-4B大模型的完整过程。作者首先在Windows环境搭建失败后转向WSL2，经过三次模型选型最终确定使用Qwen3-4B-Instruct纯文本模型。通过收集12份存储领域文档，提取清洗后获得4790条训练样本。训练采用4bit量化+LoRA技术，在31分钟内完成，显存峰值控制在5.5GB。评估发现，虽然初始测试集表现不佳，但

#python #深度学习

【大模型微调实战】第5期：从SFT三轮修复到部署量化探索——在6GB显卡上的收官之战

本文记录了从SFT模型修复到部署探索的全过程。在发现SFTv1模型存在选择性遗忘和概念理解错误后，通过三轮数据迭代（强制详述、问题改写等策略）将模型打磨至可用状态，成功解决了80%的核心问题。随后在6GB显卡环境下探索了多种部署方案（vLLM、bitsandbytes、llama.cpp、GPTQ），最终获得FP16基线数据并形成4-bit量化收益预估。项目完整呈现了模型训练与部署中的典型挑战，包

#python #深度学习

从零搭建个人科研Agent：混合模型策略与LangGraph核心闭环实战（二）：搜索系统升级与报告质量优化

摘要：ScholarCraft是一个基于混合模型的科研调研Agent，通过本地Qwen3-4B与远端MiMoAPI协同工作，实现了自主文献检索、评估与报告生成功能。项目已完成核心升级：1）搜索系统采用多角度策略与智能评估机制；2）工具能力增强，支持双路径论文读取与结构化对比；3）本地论文库扩充至26篇跨领域文献；4）报告质量提升，采用深度结构化模板。当前系统能稳定执行"搜索-评估-阅读-

#人工智能 #python

从零搭建个人科研Agent：混合模型策略与LangGraph核心闭环实战

项目摘要： ScholarCraft 是一个基于本地与云端混合模型的科研调研Agent，旨在通过自主规划、工具调用和论文阅读生成结构化报告。项目采用 LangGraph + Ollama（Qwen3-4B） + 小米MiMoAPI 技术栈，已完成核心闭环（任务规划→工具调用→联网检索→报告生成），并集成 MCP协议和迭代式检索机制。核心能力：任务规划：通过MiMoAPI拆解模糊需求为结构化

#python

共 27 条

请选择