
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
满怀期待地搭建自己的AI知识库,结果却被模型“人工智障”般的回答泼了冷水?问题很可能出在你毫不在意的数据处理第一步:文本分块。本文是「RAG 每日一技」系列的开篇,将带你从最基础的“一刀切”式分块法入手,揭示其为何是效果杀手,并为你开启构建高质量RAG系统的正确道路。
RAG只会聊文本?太OUT了!本文带你进入结构化数据问答新领域。学习如何让RAG系统“看懂”数据库表格,将自然语言问题智能转为SQL查询。从零开始,亲手构建一个能与表格数据对话的SQL-RAG机器人!
嫌Refine策略太慢?本文带你学习源自大数据思想的Map-Reduce RAG策略!通过“分路并行处理,最终汇总统一”的方式,高效地对海量文档进行总结和问答。搞懂它与Refine的区别,让你的RAG架构选择更灵活!
向量检索的“死穴”被找到了——它不认识关键词!本篇开启RAG高级技巧篇,教你用“混合搜索”来打个补丁。学习将BM25的精确与向量的语义相结合,并用RRF算法融合排序,让你的RAG既懂语义,又不丢细节!
辛苦检索的上下文,LLM却视而不见,还在一本正经地胡说八道?问题就出在你的Prompt!本文为你提供一个“黄金级”RAG提示词模板,用铁律约束AI,杜绝幻觉,让它学会“知之为知之,不知为不知”。
还在为上下文窗口不够用而发愁?本文教你一种更“像人”的RAG高级策略:迭代式精炼(Refine)。学习如何让LLM逐一阅读文档,并不断“反思”和“完善”答案,最终生成一个信息更全面、质量更高的回答!
本文分享了在纯CPU服务器上优化Embedding模型部署的经验。原方案使用Hugging Face的transformers库部署BAAI/bge-m3模型,单个请求响应需3-4秒。通过五大优化措施将性能提升3倍多:1)采用模型量化与ONNX Runtime结合,优化线程管理和图优化;2)设计LRU缓存策略管理多模型;3)使用asyncio.Semaphore控制并发请求;4)结合FastAPI
RAG框架不止LangChain!本文带你认识另一大巨头:以数据为中心的LlamaIndex。学习它与LangChain在哲学上的不同,并体验其极致的便捷性——只需3行核心代码,即可构建一个从数据加载到查询的完整RAG应用!
RAG组件太多,手动连接像在粘乐高?本文带你上手AI编排框架LangChain,学习用其核心的LCEL“管道”语法,将检索、精排、生成等高级步骤优雅地“链接”起来,告别繁琐的胶水代码,轻松构建复杂应用!







