龙哥（开学破防版）个人主页

@2402_85042123

龙哥（开学破防版）

2025-04-14 08:58:35 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

（简）RAG-Gym：强化学习训练推理链

RAGGym框架的提出是为了优化RAG在multi-hop question answer中的表现。主要使用的方法是将查询和回答视为查询代理的过程，然后通过基于马尔科夫链的奖励机制，通过微调等方法优化这个步骤。

#机器学习 #人工智能 #nlp

（简）ViDoRAG：多模态的RAG工作（重点针对多模态混合检索）

我的理解是，不同的管道对pdf等document的处理方式不同，前者是提取文字，然后分为chunk，然后进行嵌入；我们通过对两种管道k值的大费周章的动态确定，就是为了在下一步骤量化地统一对“有关”的定义，从而协同地确定真正与query相关的嵌入。在此之前，相关工作主要有普通的基于文本的RAG和对单张图像进行理解和问答的VQA模型，但是前者无法充分考虑文档中的多模态内容。传统的方法是确定数量，可能会

#人工智能

RankCoT: Refining Knowledge for Retrieval-Augmented Generation through Ranking Chain-of-Thoughts阅读笔记

第一阶段，将指令和文档输入一个我们微调好的生成CoT的模型，以生成尽可能准确的CoT形式的总结。不同于直接的RAG，经过refine的RAG模型应该经历以下过程：首先将q（query）和检索到的D（document）一起输入refine模型，生成精炼知识y，然后将y和q一起整合，作为新的query输入LLM生成答案。首先，我们的目标是训练出一个这样的模型，输入原始查询和和所有文档，输出CoT形式的

#自然语言处理

到底了