logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

使用X inference下载部署小模型(qwen1.5)测试效果

我的环境是mac m2 32G ,没办法用GPU。这是X inference的安装教程。这里是mac部署2B的教程。还有测试推理的效果,速度

文章图片
BAAI M3-Embedding 技术报告

BGE系列核心技术报告包括BGE(v1/v1.5)和BGE-M3两篇论文。BGE-M3创新性地提出统一模型解决多语言、多功能、多粒度检索问题,支持100+语言、8192token输入,能同时输出稠密、稀疏和多向量三种表示。关键技术包括位置重训、大batch训练和自知识蒸馏,在MIRACL、MKQA等评测中全面领先。该模型显著简化了现有检索系统架构,但极长文档处理仍有提升空间。相关论文可在arXiv

#深度学习#神经网络
Query Rewrite —— 基于大模型的query扩展改写,召回提升3%-15%

本文介绍了一种简单而有效的查询扩展方法。通过大语言模型(LLM)的小样本提示生成答案,然后和原始query进行拼接,作为新的query。实验结果表明query2doc 通过以下方式提高了 BM25 的性能3% 到 15%。

文章图片
#人工智能
Query Rewrite —— 基于大模型的query扩展改写,综合考虑上下文信息(人大论文)

在session上下文中,捕获用户的搜索意图,是一件较为复杂和困难的事情。一起看一下人大的这篇论文。论文中提出了一个简单而有效的提示框架,称为LLM4CS,以利用LLM作为搜索意图解释器来促进会话搜索。具体来说,我们首先提示LLM在多个视角下生成较短的查询重写和较长的假设响应,然后将这些生成的内容聚合成一个集成的表示,以稳健地表示用户的真实搜索意图。

文章图片
Query Rewrite —— 基于大模型的query扩展改写,PRF(论文)

本文介绍了一篇典型的 PRF (Pseudo-relevance feedback)思路的论文,用于利用LLM来做query改写,提升召回率,召回效果。为大家介绍PRF的主要流程,PRF的提升效果。PRF的弊端。 以及不同规模的LLM对改写的效果的影响。

文章图片
Query Rewrite —— 基于大模型的query扩展改写,PRF+ GRF协同发力减少LLM的幻觉问题(论文)

(伪相关反馈)为了解决模型的幻觉问题,在改写前,先拿原始query去进行一次query,然后将召回的数据作为参考内容,送给模型,根据这些内容重新生成query。优势:可以一定程度上解决模型幻觉问题,有效解决解决词汇表不匹配问题。毕竟是根据query召回的内容去生成query的。劣势:这将会很依赖首次的检索,如果召回的数据质量很差,就GG了。(生成相关反馈)最近关于生成相关性反馈(GRF)的研究表明

文章图片
linux负载(load)问题详解 + 压测命令集

本文详解linux中的CPU负载问题,以及结合生产中的问题进行分析。并且提供了对应的压测命令,来复现生产环境中遇到的各种与CPU相关的问题!

文章图片
服务从http 升级到https 都需要做哪些改变

项目要上线,需要把http变成https,作为安全防护的一个手段。如果不走https,只用http有什么问题?其一,通过抓包,可以看到你全部的数据。其二,通过抓包,在你的页面数据上放一些广告。还有更多,就不列举了。如果走https,都需要哪些条件?如果是demo项目的话,可以使用JDK自己签发SSL证书,这个如果只是后台访问接口,https没问题,如果是页面在googel浏览器展示,然后去调用ht

将json数据导入到ES集群——解决方案对比&填坑日记

将json数据导入到ES集群——解决方案对比&填坑日记

#git#jenkins#运维 +1
中国全部城市的中心点坐标 json格式

全部城市的中心点坐标,json格式。后台可以直接使用。{"city": {"上海": [121.487899486, 31.24916171],"临沧": [100.092612914, 23.8878061038],"丽江": [100.229628399, 26.8753510895],"保山": [99.1779956133, 25.1204891962],"大理白族自治州": [100.2

#html#css
    共 194 条
  • 1
  • 2
  • 3
  • 20
  • 请选择