logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【RAG】WeKnow-RAG:融合Web搜索与知识图谱的自适应检索增强生成方法

往期文章介绍了《【RAG】混合RAG系统,提升复杂推理任务表现》,本文再来看看KDD CUP2024的CRAG的第三名方案,该方案提出WeKnow-RAG方法,结合了知识图谱和基于Web的RAG技术,通过多阶段检索、自评估机制以及智能平衡框架,提高了信息检索的精度和生成答案的可靠性。WeKnow-RAG方法通过结合知识图谱和Web搜索,设计了一个端到端的检索增强生成系统。该方法通过多阶段检索和自评

文章图片
#知识图谱#RAG
【text2sql】DB-GPT-Hub:text2sql的微调框架及基准测试套件

text2sql任务是将自然语言问题转换为SQL查询。使用大模型来进行 sql 生成的方式也越来越常见。根据大模型用于文本到SQL生成的方式,text2sql可以分为两种场景:零样本/少样本提示和微调。:在零样本场景中,不提供示例;而在少样本场景中,提供少量输入输出示例以提示大模型。形式上,给定一个由θ参数化的LLM,问题qi​和k个示例(k≥0),目标是最大化从大型语言模型生成正确SQLsi​s

文章图片
#数据库
【文档智能】包含段落的开源的中文版面分析模型

权重下载地址:https://huggingface.co/qihoo360/360LayoutAnalysis。

文章图片
#目标检测
allenai开源多模态的文档智能解析大模型(OLMOCR)方法、效果浅析

先说结论,实际体验一般,如果是下游rag文档的元素不是特别复杂可以用一用这个端到端的多模态模型,如果版式元素丰富,还是老实进行文档解析吧。。在线demo:https://olmocr.allenai.org/开源权重地址:https://huggingface.co/allenai/olmOCR-7B-0225-preview。

文章图片
【RAG&多模态】多模态RAG-ColPali:使用视觉语言模型实现高效的文档检索

前面文章提到,文档智能解析能够有效的增强RAG系统的准确性。可以看到基于PDF的RAG,需要先对pdf进行解析,生成文本chunk,然后再基于文本建索引。这种pipline的方式,每个解析模块都需要放置对应的解析模型,存在着错误传播的问题。因此,笔者看到ColPali时,这种端到端的方案挺有意思,本文来看一看这个思路。

文章图片
#语言模型#人工智能#自然语言处理
GRPO强化学习缓解多模态大模型OCR任务的幻觉思路及数据生成思路

多模态大模型在“看不清”文字时瞎编答案,称为“OCR幻觉”,如下图,主要有几点:(1)预训练阶段缺乏相关数据:关键信息提取(KIE)数据以及退化视觉场景的清晰标注显著不足,限制了模型处理复杂视觉输入的能力。指令微调阶段忽视退化场景:现有研究通常假设 OCR 任务输入为非退化图像,导致模型缺乏处理真实世界退化文档(如模糊、遮挡、低对比度)所需的推理能力。下面来看看一个思路。供参考。

文章图片
#人工智能
字节开源的多模态端到端文档解析模型-Dolphin

前期介绍了一些pipline的文档解析实现路线和端到端的多模态解析方案,整理在:《下面来看一下字节最新开源的多模态文档解析方案,笔者实际测下来性能还有待提升(鉴于合成数据,泛化性还较差,存在幻觉),不过思路可以借鉴下,供参考。

文章图片
RAG各模块联合优化思路:多智能体协作建模-MMOA-RAG浅尝

RAG各模块联合优化思路:多智能体协作建模-MMOA-RAG浅尝现有RAG系统的:传统方法(如监督微调SFT)单独优化查询重写、文档检索、答案生成等模块,但单个模块的“”无法保证最终答案的“(ps:这一点可以通过之前的一个分类比赛准确性分析理解《》)。MMOA-RAG创新点是将RAG系统的,让所有智能体的优化目标统一对齐到“最终答案质量”(如F1分数),通过多智能体强化学习(MAPPO算法)实现模

文章图片
#RAG#人工智能
【文档智能】文本文字识别、公式识别、表格文字识别核心算法及思路及实践-DBNet、CRNN、TrOCR

OCR技术作为文档智能解析链路中的核心组件之一,贯穿整个技术链路,包括:文字识别、表格文字识别、公式识别,参看下面这张架构图:前期介绍了很多关于文档智能解析相关核心技术及思路,本着连载的目的,本次迎来介绍整个链路中的最后一块拼图-OCR。本文简要介绍OCR常见落地的算法模型-DBNet、CRNN,并基于这两个模型,简单介绍文字识别在表格识别中参与的角色;并且额外介绍TrOCR这个端到端的模型,基于

文章图片
#算法#自然语言处理
paddleocr关闭log日志打印输出

可以看到paddleocr输出logging主要有两种,DEBUG和WARNING,因此关闭这两种打印日志即可。

#python
    共 145 条
  • 1
  • 2
  • 3
  • 15
  • 请选择