logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Dify RAG混合检索基于权重重排

Dify RAG混合检索系统采用语义检索与全文检索相结合的方式,通过权重重排优化结果。语义检索基于向量空间模型计算余弦相似度,虽能捕获语义信息但存在结果偏差问题。全文检索使用BM25算法(含文档长度归一化但无全局分数归一化)。系统需对BM25分数进行范围归一化后才能与语义检索分数(0-1范围)加权融合。关键词相似度计算采用TF-IDF结合余弦相似度方法,通过结巴分词提取Top10关键词构建稀疏向量

#python#开发语言
到底了