logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

赢取千元奖品!TextIn大模型加速器+火山引擎,多语言文档处理挑战营正式启动!

赢取千元奖品!TextIn大模型加速器+火山引擎,多语言文档处理挑战营正式启动!

文章图片
#火山引擎#人工智能
赢取千元奖品!TextIn大模型加速器+火山引擎,多语言文档处理挑战营正式启动!

赢取千元奖品!TextIn大模型加速器+火山引擎,多语言文档处理挑战营正式启动!

文章图片
#火山引擎#人工智能
打工人好用的大模型问答,还需要一款可靠的文档解析工具

在常规性知识问答之外,各个细分领域的专业性问答对打工人而言更加实用。合小研在阅读长篇幅论文、报告的时候,就经常需要大模型来完成一些综述、概括、辅助分析的工作,因此,我们非常关心一个问题:如果我提供一系列资料,目前大模型能为我反馈正确、精准的专业信息吗?

文章图片
#人工智能#语言模型
2023年最全OCR技术指南!预训练OCR大模型呼之欲出

OCR是一项科技革新,通过自动化大幅减少人工录入的过程,帮助用户从图像或扫描文档中提取文字,并将这些文字转换为计算机可读格式。这一功能在许多需要进一步处理数据的场景中,如身份验证、费用管理、自动报销、业务办理等都显得尤为实用。现如今,OCR解决方案会结合AI(人工智能)和ML(机器学习)技术,以自动化处理过程并提升数据提取的准确性。本文将介绍该技术的前世今生,一览该技术的阶段性发展:传统OCR技术

文章图片
#人工智能
智能图像处理:基于边缘去除和迭代式内容矫正的复杂文档图像校正

本文简要介绍ACM MM 2022录用论文“Marior: Margin Removal and Iterative Content Rectification for Document Dewarping in the Wild”的主要工作。该论文针对现有的矫正方法只能在紧密裁剪的文档图像上获得较为理想的矫正效果这一不足,提出了一个新的矫正方法Marior。Marior采用渐进式的矫正方式来逐步

文章图片
#图像处理
PDF解析+RAG,手把手教你在Coze搭建个人知识库!

在这个信息爆炸的时代,搭建个人知识库就像是拥有了一个超级智能的“外脑”。它不仅能帮你储存知识,还能在你需要的时候迅速地调取信息,提高知识的使用效率。今天,合小研会逐步演示如何在Coze扣子平台搭建个人知识库!

文章图片
#人工智能#RAG
【论文解读】大模型算法发展

论文研究了自深度学习出现以来,预训练语言模型的算法的改进速度。使用Wikitext和Penn Treebank上超过200个语言模型评估的数据集(2012-2023年),论文发现达到设定性能阈值所需的计算大约每8个月减半一次,95%置信区间约为5到14个月,大大快于摩尔定律下的硬件增益。

文章图片
#算法
常用的表格检测识别方法 - 表格区域检测方法(下)

本文介绍了一种利用可变形transformer对文档图像进行表格检测的半监督方法。该方法通过将伪标签生成框架集成到一个简化的机制中,减轻了对大规模注释数据的需要,并简化了该过程........

文章图片
#深度学习#人工智能#计算机视觉 +1
【论文解读】针对生成任务的多模态图学习

一、简要介绍多模态学习结合了多种数据模式,拓宽了模型可以利用的数据的类型和复杂性:例如,从纯文本到图像映射对。大多数多模态学习算法专注于建模来自两种模式的简单的一对一数据对,如图像-标题对,或音频文本对。然而,在大多数现实世界中,不同模式的实体以更复杂和多方面的方式相互作用,超越了一对一的映射。论文建议将这些复杂的关系表示为图,允许论文捕获任意数量模式的数据,并使用模式之间的复杂关系,这些关系可以

文章图片
#深度学习#人工智能#机器学习
打工人好用的大模型问答,还需要一款可靠的文档解析工具

在常规性知识问答之外,各个细分领域的专业性问答对打工人而言更加实用。合小研在阅读长篇幅论文、报告的时候,就经常需要大模型来完成一些综述、概括、辅助分析的工作,因此,我们非常关心一个问题:如果我提供一系列资料,目前大模型能为我反馈正确、精准的专业信息吗?

文章图片
#人工智能#语言模型
    共 46 条
  • 1
  • 2
  • 3
  • 4
  • 5
  • 请选择