logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Windows Terminal 使用 ssh 连接阿里云服务器

在本地生成一对ssh密钥;将 C:\user\<username>\.ssh\id_rsa.pub 打开,复制其中的全部公钥内容;在阿里云官网的服务器控制台中,找到密钥管理,选择新添加一个密钥,将公钥信息填入进去;Windows Terminal的设置中增加以下内容:list下面添加:{"guid": "{27af5698-1e5f-4178-a34b-8623d8d8ec22}","

#ssh#linux#阿里云
【RAG 论文】Chain-of-Note:为 RAG 引入 CoT 让模型生成阅读笔记来提高面对噪音文档和未知场景的鲁棒性

Chain-of-Note 提示:为 RAG 引入 CoT 让模型生成阅读笔记来提高面对噪声文档和未知场景的鲁棒性

文章图片
#人工智能#RAG#自然语言处理 +1
【LLM 论文】思维链 CoT 提示方法:Chain-of-Thought Prompting Elicits Reasoning in Large Language Models

论文精读:Chain-of-Thought Prompting Elicits Reasoning in Large Language Models使用思维链提示来增强语言模型的表现

文章图片
#语言模型#人工智能#自然语言处理
【Text2SQL】WikiSQL 数据集与 Seq2SQL 模型

这篇论文给出了一个 WikiSQL 数据集,并提出了 Text2SQL 的一个解决方案以及评价指标。但是很明显,该方案存在不少缺点,之后的方案会继续改进。

文章图片
#人工智能#语言模型#自然语言处理 +1
【RAG 论文】Iter-RetGen:多轮迭代检索增强生成

它想让 retriever 根据 q 检索到的文档与 re-ranker 认为的在给了 y1 后与 q 最相关的文档是尽可能相似的,这样 re-ranker 可以教会 retriever 什么才是与 q 相关的文档,同时可以训练 retriever 不要偏离原问题 q,因为随着迭代,会引入很多其他信息,但不要让 retriever 偏离了原来的问题 q 而专注于子问题。拼接,交给 retrieve

文章图片
#人工智能#语言模型#自然语言处理 +2
【Text2SQL】Spider 数据集

模型将被在不同的复杂 SQL、复杂数据库、复杂 domains 上被测试,要求模型能够对 question 理解语义,并对新的数据库有泛化能力。任务不评估模型生成 value 的能力,因为这个 benchmark 侧重评估预测出正确的 SQL 结构和 columns,数据集中也被排除了需要常识推理和数学计算的 querys。论文工作还对数据库的 table names 和 column names

文章图片
#深度学习#人工智能#自然语言处理
    共 32 条
  • 1
  • 2
  • 3
  • 4
  • 请选择