logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

MCP(model content protocol) 调研

前两周深度调研来MCP,也深度的体验了MCP(这篇文章整理里详细的资料)。一个本质问题,MCP实际上在构建function call的参数。世纪感受下来,虽然MCPserver非常多,但是实际使用起来一言难进,感觉都是完整度在10%-30%的半成品。此外即使配合claude使用这些工具也挺难用的。

文章图片
BAAI M3-Embedding 技术报告

BGE系列核心技术报告包括BGE(v1/v1.5)和BGE-M3两篇论文。BGE-M3创新性地提出统一模型解决多语言、多功能、多粒度检索问题,支持100+语言、8192token输入,能同时输出稠密、稀疏和多向量三种表示。关键技术包括位置重训、大batch训练和自知识蒸馏,在MIRACL、MKQA等评测中全面领先。该模型显著简化了现有检索系统架构,但极长文档处理仍有提升空间。相关论文可在arXiv

#深度学习#神经网络
文本向量模型技术报告

文本向量模型技术报告摘要 本报告对比分析2025年主流向量模型(BGE-M3、Qwen3-Embedding、Jina-v3/v4)的技术特性与性能表现。关键发现: 技术路线:BGE-M3采用经典Encoder优化,Qwen3基于生成式架构改造,Jina支持可变维度与Late-Chunking 长文本处理:实验显示8k切块+10%重叠+两阶段召回方案在精度(nDCG@10 0.768)与成本(显存

文章图片
下一代搜索引擎会什么?

现在是北京时间2023年11月18日。聊一聊搜索。说到搜索,大家首先想到的肯定是谷歌,百度。我把这些定义成上一个时代的搜索引擎。ChatGPT已经火热了有一年的时间了,大家都认为Ai搜索是下一代的搜索。但是AI搜索,需要的是很大算力,需要很大存储空间。至今为止又有多少个公司能够真的去做AI搜索呢?普通的公司又能够做什么呢?ChatGPT是大模型,它的数据总是停留在历史的某个时间点上,目前来看,它对

文章图片
#搜索引擎
使用X inference下载部署小模型(qwen1.5)测试效果

我的环境是mac m2 32G ,没办法用GPU。这是X inference的安装教程。这里是mac部署2B的教程。还有测试推理的效果,速度

文章图片
BAAI M3-Embedding 技术报告

BGE系列核心技术报告包括BGE(v1/v1.5)和BGE-M3两篇论文。BGE-M3创新性地提出统一模型解决多语言、多功能、多粒度检索问题,支持100+语言、8192token输入,能同时输出稠密、稀疏和多向量三种表示。关键技术包括位置重训、大batch训练和自知识蒸馏,在MIRACL、MKQA等评测中全面领先。该模型显著简化了现有检索系统架构,但极长文档处理仍有提升空间。相关论文可在arXiv

#深度学习#神经网络
Query Rewrite —— 基于大模型的query扩展改写,召回提升3%-15%

本文介绍了一种简单而有效的查询扩展方法。通过大语言模型(LLM)的小样本提示生成答案,然后和原始query进行拼接,作为新的query。实验结果表明query2doc 通过以下方式提高了 BM25 的性能3% 到 15%。

文章图片
#人工智能
Query Rewrite —— 基于大模型的query扩展改写,综合考虑上下文信息(人大论文)

在session上下文中,捕获用户的搜索意图,是一件较为复杂和困难的事情。一起看一下人大的这篇论文。论文中提出了一个简单而有效的提示框架,称为LLM4CS,以利用LLM作为搜索意图解释器来促进会话搜索。具体来说,我们首先提示LLM在多个视角下生成较短的查询重写和较长的假设响应,然后将这些生成的内容聚合成一个集成的表示,以稳健地表示用户的真实搜索意图。

文章图片
Query Rewrite —— 基于大模型的query扩展改写,PRF(论文)

本文介绍了一篇典型的 PRF (Pseudo-relevance feedback)思路的论文,用于利用LLM来做query改写,提升召回率,召回效果。为大家介绍PRF的主要流程,PRF的提升效果。PRF的弊端。 以及不同规模的LLM对改写的效果的影响。

文章图片
Query Rewrite —— 基于大模型的query扩展改写,PRF+ GRF协同发力减少LLM的幻觉问题(论文)

(伪相关反馈)为了解决模型的幻觉问题,在改写前,先拿原始query去进行一次query,然后将召回的数据作为参考内容,送给模型,根据这些内容重新生成query。优势:可以一定程度上解决模型幻觉问题,有效解决解决词汇表不匹配问题。毕竟是根据query召回的内容去生成query的。劣势:这将会很依赖首次的检索,如果召回的数据质量很差,就GG了。(生成相关反馈)最近关于生成相关性反馈(GRF)的研究表明

文章图片
    共 141 条
  • 1
  • 2
  • 3
  • 15
  • 请选择