
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
本文记录了从零开始搭建企业级RAG系统的环境准备阶段,重点介绍了Milvus向量数据库的部署过程。作者使用Windows11+WSL2 Ubuntu22.04的开发环境,详细说明了Docker安装、GPU支持配置以及国内镜像加速设置。文章提供了完整的Milvus部署指南,包括docker-compose配置、服务验证和Python客户端连接测试,并分享了项目目录结构设计的最佳实践。作为系列教程的第

本文介绍了在企业级RAG系统中整合Redis缓存、Prometheus监控和Grafana仪表盘的全过程。通过修改docker-compose.yml文件追加三个新服务,配置Prometheus抓取指标,并详细记录了网络冲突、权限拒绝等典型问题的排查方法。文章提供了WSL2环境下的解决方案,包括清理冲突网络、设置目录权限等实用技巧,最终实现了6个服务同时运行的稳定状态。同时给出了Milvus数据库

本文详细介绍了如何从零构建一个企业级RAG系统的知识库模块。主要内容包括:1)设计Milvus向量数据库Schema并实现连接管理;2)开发支持多格式的文档分块模块;3)构建数据灌入流程,将14篇高质量AI领域文章处理为718个文本块;4)实现混合检索(向量+关键词)和Reranker精排模块,通过实验验证Reranker能有效纠正检索偏差;5)完成工程规范化,包括依赖管理、目录结构和问题排查记录

本文详细介绍了企业级RAG系统的核心模块实现,重点解决了从知识库到智能问答的全链路优化问题。系统采用混合检索(向量+BM25+RRF融合)提升召回效果,引入Reranker精排模块提高答案质量,并通过双层缓存架构(L1精确缓存+L2语义缓存)将响应时间从20秒降至毫秒级。文章不仅提供了代码实现细节和踩坑经验,还分析了当前系统的局限性,并规划了查询改写、动态阈值等优化方向,为构建生产级RAG系统提供

《从0.50到0.80:LiteRAG召回率优化实战》记录了将RAG系统核心指标全面优化的完整过程。文章首先通过RAGAS评估框架发现初始系统存在高精度低召回问题(ContextRecall仅0.50),随后通过代码审计发现4个P0级缺陷,包括查询改写禁用、缓存设计缺陷等。核心优化包括:升级多语言Embedding模型、强化专业术语分词、引入加权RRF融合算法,最终将召回率提升60%至0.80,精

本文介绍了如何将LiteRAG系统从单轮问答升级为具备多轮对话能力、记忆功能和友好界面的智能助手。主要改进包括:1) 实现查询改写功能处理指代问题;2) 基于Redis设计多轮对话会话管理;3) 部署本地LLM解决云端API不稳定问题;4) 重构Gradio界面支持多会话管理。文章详细记录了技术方案选择、实现细节和问题排查过程,特别分享了持续10小时的缓存污染问题排查经历,最终使系统在忠实度、相关

本文记录了一位开发者使用RTX3060笔记本(6GB显存)微调Qwen3-4B大模型的完整过程。作者首先在Windows环境搭建失败后转向WSL2,经过三次模型选型最终确定使用Qwen3-4B-Instruct纯文本模型。通过收集12份存储领域文档,提取清洗后获得4790条训练样本。训练采用4bit量化+LoRA技术,在31分钟内完成,显存峰值控制在5.5GB。评估发现,虽然初始测试集表现不佳,但

本文记录了从SFT模型修复到部署探索的全过程。在发现SFTv1模型存在选择性遗忘和概念理解错误后,通过三轮数据迭代(强制详述、问题改写等策略)将模型打磨至可用状态,成功解决了80%的核心问题。随后在6GB显卡环境下探索了多种部署方案(vLLM、bitsandbytes、llama.cpp、GPTQ),最终获得FP16基线数据并形成4-bit量化收益预估。项目完整呈现了模型训练与部署中的典型挑战,包

摘要:ScholarCraft是一个基于混合模型的科研调研Agent,通过本地Qwen3-4B与远端MiMoAPI协同工作,实现了自主文献检索、评估与报告生成功能。项目已完成核心升级:1)搜索系统采用多角度策略与智能评估机制;2)工具能力增强,支持双路径论文读取与结构化对比;3)本地论文库扩充至26篇跨领域文献;4)报告质量提升,采用深度结构化模板。当前系统能稳定执行"搜索-评估-阅读-
项目摘要: ScholarCraft 是一个基于本地与云端混合模型的科研调研Agent,旨在通过自主规划、工具调用和论文阅读生成结构化报告。项目采用 LangGraph + Ollama(Qwen3-4B) + 小米MiMoAPI 技术栈,已完成核心闭环(任务规划→工具调用→联网检索→报告生成),并集成 MCP协议 和 迭代式检索机制。 核心能力: 任务规划:通过MiMoAPI拆解模糊需求为结构化







