
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
Jina v3 向量检索实战评测:跨语、长文本与大库的避坑指南(附复现代码)
最近在落地基于 RAG 的 Agent 应用时,对爆火的 Jina Embeddings v3 做了一次深度评测。结果发现:5k 规模下表现完美的模型,到了 100k 真实业务库却严重掉点;某种自定义的“长-长同源检索”虽然跑出满分,但换用真实技术问答(BRIGHT)和合同数据集(ACORD)后,MRR 直接跌到 0.17。本文将详细拆解这次评测的实验设计、核心数据以及背后的业务逻辑,并给出真实业
Jina v3 向量检索实战评测:跨语、长文本与大库的避坑指南(附复现代码)
最近在落地基于 RAG 的 Agent 应用时,对爆火的 Jina Embeddings v3 做了一次深度评测。结果发现:5k 规模下表现完美的模型,到了 100k 真实业务库却严重掉点;某种自定义的“长-长同源检索”虽然跑出满分,但换用真实技术问答(BRIGHT)和合同数据集(ACORD)后,MRR 直接跌到 0.17。本文将详细拆解这次评测的实验设计、核心数据以及背后的业务逻辑,并给出真实业
到底了







