
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
本文探讨了优化RAG问答系统的关键方法——Chunk分块与Overlap重叠技术。文章指出,合理的文本分块能解决大模型处理长文本时的计算限制,而重叠设计可避免语义割裂。作者分享了分块大小的选择原则(适中+重叠)、不同文档类型的适配方案,并提供了Python实现代码。通过对比优化前后的检索效果,展示了该方法如何提升问答准确性。文章还总结了实践中的常见问题(如分块过大导致检索不准)及解决方案(调整分块
本文探讨了优化RAG问答系统的关键方法——Chunk分块与Overlap重叠技术。文章指出,合理的文本分块能解决大模型处理长文本时的计算限制,而重叠设计可避免语义割裂。作者分享了分块大小的选择原则(适中+重叠)、不同文档类型的适配方案,并提供了Python实现代码。通过对比优化前后的检索效果,展示了该方法如何提升问答准确性。文章还总结了实践中的常见问题(如分块过大导致检索不准)及解决方案(调整分块
AI问答助手升级为基于向量数据库的RAG系统,主要改进包括: 从关键词匹配升级为语义检索,使用FAISS向量数据库和Sentence-Transformer嵌入模型 实现流程:文档切分→向量化→构建索引→语义搜索→结果整合 系统首次运行时构建向量库并保存,后续直接加载 测试验证了模型加载、向量生成和检索功能 解决了模型下载失败等常见问题 升级后系统能更准确理解用户意图,实现同义词和语义检索,显著提
在前面三篇中,我们依次梳理了项目整体架构、完成了的选型,也确定了后续要使用的。理论和选型部分已经铺垫完成,从这一篇开始,我们正式进入环节。无论使用哪种模型,AI 问答助手的核心第一步都是。只有先把 API 调通,确保能够正常获取模型返回结果,后续的 RAG 检索、对话逻辑、交互界面才有基础。本篇我们就以实现为例,并封装成统一接口,为后续接入知识库做好准备。
本文探讨了AI问答助手交互形式的两种主要选择:CLI(命令行界面)和Web界面。CLI适合快速开发和验证核心功能,具有调试方便、资源占用低等优点,但用户体验较差;Web界面则更接近真实产品,用户体验好但开发复杂度高。文章建议采用"先CLI后Web"的开发路径,先验证核心逻辑再考虑产品化。关键是要将核心功能模块化,使其可以同时支持CLI和Web两种交互方式。通过合理设计项目结构,
摘要: 云模型(如OpenAI)和本地模型(如LLaMA)的核心区别在于部署方式与数据管控。云模型通过API调用,优势在于零部署成本、高性能和快速开发,但存在数据外泄风险及按量计费成本问题;本地模型需自行部署,数据完全私有且长期成本更低,但硬件门槛高且性能较弱。选择依据:个人或非敏感项目优先云模型;企业敏感数据或高频调用场景选本地模型。设计上可通过抽象层(统一接口)实现两者灵活切换,但需调整Pro
摘要:该项目旨在构建一个基于大语言模型(LLM)的AI问答助手系统,采用检索增强生成(RAG)架构实现知识增强。系统流程包括:1)用户提问;2)文本向量化;3)向量数据库检索相关文档;4)拼接Prompt;5)LLM生成答案。核心技术栈包括Python、OpenAI/DeepSeek模型、FAISS向量数据库和FastAPI框架。项目核心价值在于让AI基于私有知识库回答问题,而非仅依赖训练数据。关
2025年终总结回顾了工作、学习与生活三方面的成长。工作方面,两次参加系统架构设计师考试虽未完全通过,但提升了架构设计能力;申请学位证未果但弥补了遗憾;从前司离职后获得重新学习的机会。个人成长方面,阅读架构师和理财书籍,提升情绪管理和AI辅助学习能力,思维转变为更注重过程与解决方案。健康方面保持规律运动。2026年计划包括完成多本书籍阅读、深化计算机和逻辑学概念学习、继续职业考试及维持健康习惯。总
【背景】小编上周刚考完了这两科,因为这次的学习还蛮有收获,所以总结一下。【内容】引论计算机系统硬件软件操作系统什么是作用功能形成与基本类型批处理分时实时操作系统的发展微机操作系统网络操纵系统分布式操作系统嵌入式操作系统当前流行的操作系统简介处理器的工作状态特权指令管态和目态程序状态字操作系统与用户的接口系统调用操作控制命令处理器管理多道程序设计程序的顺序执行程序的并行执行多道程序设计进程的概念定义
目录一、项目前提:二、开发过程:1、准备工作:2、具体代码编写:2、父组件的配置:项目启动,预览最后的显示效果:最后的开发效果图如下:【背景】体测项目中需要在手机端的教师端实现能查看新建的分组里加入的所有学生,因为整个项目是使用的ionic,所以采用ionic实现,还有其他的实现方式,这里主要介绍一下如何用ionic实现。【内容】一、项目前提:据开发...







