
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
智能文档图像处理技术是指利用计算机视觉和人工智能等技术对文档图像进行处理和分析,实现自动化识别、提取、分类和管理的技术。随着人工智能时代的到来和各行业信息化进程的加速,越来越多的个人和企业用户开始借助智能文档图像处理技术来提高工作效率,降低人力成本,并减少出错率。本文将探讨智能文档图像处理技术的基本原理和特点,回顾了合合信息在 VALSE 2023 会议上关于智能文档图像处理技术的相关分享,并详细

Tesseract是一个开源 OCR 引擎,可以直接通过命令行使用,或者通过使用API从图像中提取文本。它为多种语言提供了API,其中显然包括Python。Tesseract支持unicode (UTF-8),可以识别 100 多种语言。Tesseract支持各种输出格式,包括纯文本、HTML、PDF、TSV等。本文介绍了Windows下Tesseract的安装和如何通过Python调用Tesse

Ian Goodfellow 在首次提出GAN,使用了形象的比喻来介绍 GAN 模型:生成网络 G 的功能就是产生逼真的假钞试图欺骗鉴别器 D,鉴别器 D 通过学习真钞和生成器 G 生成的假钞来掌握钞票的鉴别方法。这两个网络在相互博弈中进行训练,直到生成器 G 产生的假钞使鉴别器 D 难以分辨。而DCGAN是使用卷积操作和反卷积操作来替代原始GAN中的全连接操作。
本文介绍了如何将新颖的深度学习技术应用于古老文字的识别上,介绍了合合信息如何解决古彝文识别中的困难与挑战。依托于合合信息在古文字识别领域的积累,相对于传统古彝文识别模型,合合信息携手上海大学提出的基于深度学习的古彝文识别模型能够以更高的精度识别古彝文手写体,极大的提高了古彝文识别的准确率。

在计算机中通常使用像素矩阵表示图像,像素的位置对应图像的坐标,像素深度用于定义表示像素值的位数,图像通道在RGB色彩模式下就是指那单独的红色、绿色、蓝色部分。
在遗传算法 (Genetic Algorithms, GA) 中,使用选择、交叉、突变和适应度来模拟生物减数分裂或繁殖的基本操作。适应度是衡量个体优劣的指标,可以用于量化模拟个体成功解决给定问题的能力。通过修改遗传算法超参数,如种群大小、世代数、交叉率和突变率等超参数,能够调整和修改进化进程。在本节中,我们介绍了遗传算法基本概念及算法流程,并使用 Python 实现遗传算法解决 OneMax 问题

通过爬取“触站”批量获取高清二次元图片(以“女孩子”板块为例),并将获取的webp格式的图片转化为更为常见的png格式图片。尽管二次元知识人类幻想出来的唯美世界,但其本质上还是我们心中模糊的对梦想生活的憧憬和对美好未来的期望,学习Python爬虫,一起获取二次元女友(们)吧。
本文介绍了如何将新颖的深度学习技术应用于古老文字的识别上,介绍了合合信息如何解决古彝文识别中的困难与挑战。依托于合合信息在古文字识别领域的积累,相对于传统古彝文识别模型,合合信息携手上海大学提出的基于深度学习的古彝文识别模型能够以更高的精度识别古彝文手写体,极大的提高了古彝文识别的准确率。

使用python,下载加密的流媒体m3u8视频文件,爬虫获取电影资源。M3U8是Unicode版本的M3U,用UTF-8编码。m3u8文件其实是 HTTP Live Streaming(缩写为`HLS`)协议的部分内容。HLS 的工作原理是把整个流分成多个小的文件来下载,每次只下载一些。当媒体流正在播放时,客户端可以选择从许多不同的备用源中以不同的速率下载同样的资源,允许流媒体会话适应不同的数据速
随着人工智能技术的不断发展,尤其是深度学习技术的广泛应用,多模态数据处理和大模型训练已成为当下研究的热点之一,这些技术也为文档图像智能处理和分析领域带来了新的发展机遇。在本节中,回顾来自中科院自动化研究所、北京大学、中科大的学术专家与合合信息等知名企业的研究者在中国图形图像大会 (CCIG 2023) 关于文档图像分析与处理的相关分享,介绍在多模态大模型时代下文档图像智能分析与处理技术的最新进展和








