logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

RAG 每日一技(一):你的第一步就走错了?聊聊最基础的文本分块

满怀期待地搭建自己的AI知识库,结果却被模型“人工智障”般的回答泼了冷水?问题很可能出在你毫不在意的数据处理第一步:文本分块。本文是「RAG 每日一技」系列的开篇,将带你从最基础的“一刀切”式分块法入手,揭示其为何是效果杀手,并为你开启构建高质量RAG系统的正确道路。

#人工智能#后端#语言模型
RAG 每日一技(十七):不止聊文本,如何让RAG“看懂”表格数据?

RAG只会聊文本?太OUT了!本文带你进入结构化数据问答新领域。学习如何让RAG系统“看懂”数据库表格,将自然语言问题智能转为SQL查询。从零开始,亲手构建一个能与表格数据对话的SQL-RAG机器人!

#人工智能#数据库#算法 +4
RAG 每日一技(十二):多路并进,融会贯通!聊聊Map-Reduce RAG策略

嫌Refine策略太慢?本文带你学习源自大数据思想的Map-Reduce RAG策略!通过“分路并行处理,最终汇总统一”的方式,高效地对海量文档进行总结和问答。搞懂它与Refine的区别,让你的RAG架构选择更灵活!

#人工智能#语言模型#算法 +4
RAG 每日一技(十):向量检索的“死穴”?用混合搜索(Hybrid Search)来拯救!

向量检索的“死穴”被找到了——它不认识关键词!本篇开启RAG高级技巧篇,教你用“混合搜索”来打个补丁。学习将BM25的精确与向量的语义相结合,并用RRF算法融合排序,让你的RAG既懂语义,又不丢细节!

#后端#人工智能#语言模型 +3
RAG 每日一技(八):连接大脑!为RAG定制强大的Prompt

辛苦检索的上下文,LLM却视而不见,还在一本正经地胡说八道?问题就出在你的Prompt!本文为你提供一个“黄金级”RAG提示词模板,用铁律约束AI,杜绝幻觉,让它学会“知之为知之,不知为不知”。

#人工智能#后端#语言模型
RAG 每日一技(十一):只检索还不够爽?迭代式文档精炼(Refine)了解一下!

还在为上下文窗口不够用而发愁?本文教你一种更“像人”的RAG高级策略:迭代式精炼(Refine)。学习如何让LLM逐一阅读文档,并不断“反思”和“完善”答案,最终生成一个信息更全面、质量更高的回答!

#人工智能#后端#语言模型 +4
告别GPU焦虑:如何在纯CPU服务器上,打造高性能Embedding服务?

本文分享了在纯CPU服务器上优化Embedding模型部署的经验。原方案使用Hugging Face的transformers库部署BAAI/bge-m3模型,单个请求响应需3-4秒。通过五大优化措施将性能提升3倍多:1)采用模型量化与ONNX Runtime结合,优化线程管理和图优化;2)设计LRU缓存策略管理多模型;3)使用asyncio.Semaphore控制并发请求;4)结合FastAPI

#后端#人工智能
RAG 每日一技(十五):换个“引擎”看世界——以数据为中心的LlamaIndex

RAG框架不止LangChain!本文带你认识另一大巨头:以数据为中心的LlamaIndex。学习它与LangChain在哲学上的不同,并体验其极致的便捷性——只需3行核心代码,即可构建一个从数据加载到查询的完整RAG应用!

#后端#人工智能#语言模型 +4
RAG 每日一技(十四):化繁为简,统揽全局——用LangChain构建高级RAG流程

RAG组件太多,手动连接像在粘乐高?本文带你上手AI编排框架LangChain,学习用其核心的LCEL“管道”语法,将检索、精排、生成等高级步骤优雅地“链接”起来,告别繁琐的胶水代码,轻松构建复杂应用!

#人工智能#后端#语言模型 +3
到底了