
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
本文介绍了在IDEA中连接MongoDB数据库的操作步骤:1)点击侧边栏"Database";2)选择"MongoDB"数据源;3)填写数据库连接信息;4)测试连接并保存;5)选择需要展示的Schemas;6)根据需要选择数据展示形式。通过图文结合的方式详细演示了从创建连接到最终查看数据的完整流程。
摘要:该项目旨在构建一个基于大语言模型(LLM)的AI问答助手系统,采用检索增强生成(RAG)架构实现知识增强。系统流程包括:1)用户提问;2)文本向量化;3)向量数据库检索相关文档;4)拼接Prompt;5)LLM生成答案。核心技术栈包括Python、OpenAI/DeepSeek模型、FAISS向量数据库和FastAPI框架。项目核心价值在于让AI基于私有知识库回答问题,而非仅依赖训练数据。关
摘要: 云模型(如OpenAI)和本地模型(如LLaMA)的核心区别在于部署方式与数据管控。云模型通过API调用,优势在于零部署成本、高性能和快速开发,但存在数据外泄风险及按量计费成本问题;本地模型需自行部署,数据完全私有且长期成本更低,但硬件门槛高且性能较弱。选择依据:个人或非敏感项目优先云模型;企业敏感数据或高频调用场景选本地模型。设计上可通过抽象层(统一接口)实现两者灵活切换,但需调整Pro
去年下半年抽空看完了B站的python入门教程,不过大都是在一个python文件里写东西,没有新建项目,前一阵正好在做AI问答助手项目,需要新建python项目,遂找教程学习了一下,以下为学习结果记录。
本文探讨了RAG系统中Top-K检索策略的关键作用与调优方法。Top-K决定了检索片段的数量,直接影响回答质量:K值过小会导致信息不完整(推荐小型项目K=3~5),过大则引入噪声。通过对比K=1、3、5的测试结果,验证了中等K值的优势。文章提出了三种优化方案:1)基础的长度限制法;2)动态K值策略(根据问题长度调整);3)高级的语义判断法(按问题类型分配K值)。最佳实践建议结合相似度阈值过滤,并控
本文探讨了优化RAG问答系统的关键方法——Chunk分块与Overlap重叠技术。文章指出,合理的文本分块能解决大模型处理长文本时的计算限制,而重叠设计可避免语义割裂。作者分享了分块大小的选择原则(适中+重叠)、不同文档类型的适配方案,并提供了Python实现代码。通过对比优化前后的检索效果,展示了该方法如何提升问答准确性。文章还总结了实践中的常见问题(如分块过大导致检索不准)及解决方案(调整分块
本文探讨了优化RAG问答系统的关键方法——Chunk分块与Overlap重叠技术。文章指出,合理的文本分块能解决大模型处理长文本时的计算限制,而重叠设计可避免语义割裂。作者分享了分块大小的选择原则(适中+重叠)、不同文档类型的适配方案,并提供了Python实现代码。通过对比优化前后的检索效果,展示了该方法如何提升问答准确性。文章还总结了实践中的常见问题(如分块过大导致检索不准)及解决方案(调整分块
AI问答助手升级为基于向量数据库的RAG系统,主要改进包括: 从关键词匹配升级为语义检索,使用FAISS向量数据库和Sentence-Transformer嵌入模型 实现流程:文档切分→向量化→构建索引→语义搜索→结果整合 系统首次运行时构建向量库并保存,后续直接加载 测试验证了模型加载、向量生成和检索功能 解决了模型下载失败等常见问题 升级后系统能更准确理解用户意图,实现同义词和语义检索,显著提
在前面三篇中,我们依次梳理了项目整体架构、完成了的选型,也确定了后续要使用的。理论和选型部分已经铺垫完成,从这一篇开始,我们正式进入环节。无论使用哪种模型,AI 问答助手的核心第一步都是。只有先把 API 调通,确保能够正常获取模型返回结果,后续的 RAG 检索、对话逻辑、交互界面才有基础。本篇我们就以实现为例,并封装成统一接口,为后续接入知识库做好准备。
本文探讨了AI问答助手交互形式的两种主要选择:CLI(命令行界面)和Web界面。CLI适合快速开发和验证核心功能,具有调试方便、资源占用低等优点,但用户体验较差;Web界面则更接近真实产品,用户体验好但开发复杂度高。文章建议采用"先CLI后Web"的开发路径,先验证核心逻辑再考虑产品化。关键是要将核心功能模块化,使其可以同时支持CLI和Web两种交互方式。通过合理设计项目结构,







