WilsonKang 个人主页

@WilsonKang

WilsonKang

2025-06-30 17:13:46 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

RAG 每日一技（一）：你的第一步就走错了？聊聊最基础的文本分块

满怀期待地搭建自己的AI知识库，结果却被模型“人工智障”般的回答泼了冷水？问题很可能出在你毫不在意的数据处理第一步：文本分块。本文是「RAG 每日一技」系列的开篇，将带你从最基础的“一刀切”式分块法入手，揭示其为何是效果杀手，并为你开启构建高质量RAG系统的正确道路。

#人工智能 #后端 #语言模型

RAG 每日一技（十七）：不止聊文本，如何让RAG“看懂”表格数据？

RAG只会聊文本？太OUT了！本文带你进入结构化数据问答新领域。学习如何让RAG系统“看懂”数据库表格，将自然语言问题智能转为SQL查询。从零开始，亲手构建一个能与表格数据对话的SQL-RAG机器人！

#人工智能 #数据库 #算法 +4

RAG 每日一技（十二）：多路并进，融会贯通！聊聊Map-Reduce RAG策略

嫌Refine策略太慢？本文带你学习源自大数据思想的Map-Reduce RAG策略！通过“分路并行处理，最终汇总统一”的方式，高效地对海量文档进行总结和问答。搞懂它与Refine的区别，让你的RAG架构选择更灵活！

#人工智能 #语言模型 #算法 +4

RAG 每日一技（十）：向量检索的“死穴”？用混合搜索（Hybrid Search）来拯救！

向量检索的“死穴”被找到了——它不认识关键词！本篇开启RAG高级技巧篇，教你用“混合搜索”来打个补丁。学习将BM25的精确与向量的语义相结合，并用RRF算法融合排序，让你的RAG既懂语义，又不丢细节！

#后端 #人工智能 #语言模型 +3

RAG 每日一技（八）：连接大脑！为RAG定制强大的Prompt

辛苦检索的上下文，LLM却视而不见，还在一本正经地胡说八道？问题就出在你的Prompt！本文为你提供一个“黄金级”RAG提示词模板，用铁律约束AI，杜绝幻觉，让它学会“知之为知之，不知为不知”。

#人工智能 #后端 #语言模型

RAG 每日一技（十一）：只检索还不够爽？迭代式文档精炼（Refine）了解一下！

还在为上下文窗口不够用而发愁？本文教你一种更“像人”的RAG高级策略：迭代式精炼（Refine）。学习如何让LLM逐一阅读文档，并不断“反思”和“完善”答案，最终生成一个信息更全面、质量更高的回答！

#人工智能 #后端 #语言模型 +4

告别GPU焦虑：如何在纯CPU服务器上，打造高性能Embedding服务？

本文分享了在纯CPU服务器上优化Embedding模型部署的经验。原方案使用Hugging Face的transformers库部署BAAI/bge-m3模型，单个请求响应需3-4秒。通过五大优化措施将性能提升3倍多：1）采用模型量化与ONNX Runtime结合，优化线程管理和图优化；2）设计LRU缓存策略管理多模型；3）使用asyncio.Semaphore控制并发请求；4）结合FastAPI

#后端 #人工智能

RAG 每日一技（十五）：换个“引擎”看世界——以数据为中心的LlamaIndex

RAG框架不止LangChain！本文带你认识另一大巨头：以数据为中心的LlamaIndex。学习它与LangChain在哲学上的不同，并体验其极致的便捷性——只需3行核心代码，即可构建一个从数据加载到查询的完整RAG应用！

#后端 #人工智能 #语言模型 +4

RAG 每日一技（十四）：化繁为简，统揽全局——用LangChain构建高级RAG流程

RAG组件太多，手动连接像在粘乐高？本文带你上手AI编排框架LangChain，学习用其核心的LCEL“管道”语法，将检索、精排、生成等高级步骤优雅地“链接”起来，告别繁琐的胶水代码，轻松构建复杂应用！

#人工智能 #后端 #语言模型 +3

到底了