
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
在本地生成一对ssh密钥;将 C:\user\<username>\.ssh\id_rsa.pub 打开,复制其中的全部公钥内容;在阿里云官网的服务器控制台中,找到密钥管理,选择新添加一个密钥,将公钥信息填入进去;Windows Terminal的设置中增加以下内容:list下面添加:{"guid": "{27af5698-1e5f-4178-a34b-8623d8d8ec22}","
Chain-of-Note 提示:为 RAG 引入 CoT 让模型生成阅读笔记来提高面对噪声文档和未知场景的鲁棒性

论文精读:Chain-of-Thought Prompting Elicits Reasoning in Large Language Models使用思维链提示来增强语言模型的表现

DPR —— 经典地使用嵌入向量来检索文档的模型

这篇论文给出了一个 WikiSQL 数据集,并提出了 Text2SQL 的一个解决方案以及评价指标。但是很明显,该方案存在不少缺点,之后的方案会继续改进。

它想让 retriever 根据 q 检索到的文档与 re-ranker 认为的在给了 y1 后与 q 最相关的文档是尽可能相似的,这样 re-ranker 可以教会 retriever 什么才是与 q 相关的文档,同时可以训练 retriever 不要偏离原问题 q,因为随着迭代,会引入很多其他信息,但不要让 retriever 偏离了原来的问题 q 而专注于子问题。拼接,交给 retrieve

CRAG —— 可矫正的检索增强生成

模型将被在不同的复杂 SQL、复杂数据库、复杂 domains 上被测试,要求模型能够对 question 理解语义,并对新的数据库有泛化能力。任务不评估模型生成 value 的能力,因为这个 benchmark 侧重评估预测出正确的 SQL 结构和 columns,数据集中也被排除了需要常识推理和数学计算的 querys。论文工作还对数据库的 table names 和 column names

RAG-Fusion:引入 Multi-Query 来丰富用户查询的结果
