logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Jina v3 向量检索实战评测:跨语、长文本与大库的避坑指南(附复现代码)

最近在落地基于 RAG 的 Agent 应用时,对爆火的 Jina Embeddings v3 做了一次深度评测。结果发现:5k 规模下表现完美的模型,到了 100k 真实业务库却严重掉点;某种自定义的“长-长同源检索”虽然跑出满分,但换用真实技术问答(BRIGHT)和合同数据集(ACORD)后,MRR 直接跌到 0.17。本文将详细拆解这次评测的实验设计、核心数据以及背后的业务逻辑,并给出真实业

#jina#RAG
Jina v3 向量检索实战评测:跨语、长文本与大库的避坑指南(附复现代码)

最近在落地基于 RAG 的 Agent 应用时,对爆火的 Jina Embeddings v3 做了一次深度评测。结果发现:5k 规模下表现完美的模型,到了 100k 真实业务库却严重掉点;某种自定义的“长-长同源检索”虽然跑出满分,但换用真实技术问答(BRIGHT)和合同数据集(ACORD)后,MRR 直接跌到 0.17。本文将详细拆解这次评测的实验设计、核心数据以及背后的业务逻辑,并给出真实业

#jina#RAG
到底了