Linux 平台的 OCR软件，OCR技术的10个开源框架

文章共2,361字 · 阅读需要大约8分钟

一键AI生成摘要，助你高效阅读

问答

ken2232

1201人浏览 · 2024-03-02 21:15:00

ken2232 · 2024-03-02 21:15:00 发布

Linux平台的OCR软件：gImageReader

OCR技术的10个开源框架，让你快速构建OCR应用

--------------------------------------------------------------------

要点：

1. 即使从 linux官方仓库成功安装了 gImageReader ，还是需要自己安装 Tesseract-OCR语言包的。

原因：Tesseract-OCR语言包太大了，官方不会？将它们也放入自己的官方仓库里。

2. 全部的语言包太大了，在 GitHub上，通过网页可能不支持单独下载 ?? ： https://github.com/tesseract-ocr/tessdata

a. 码云？通过码云来转换一下？ https://gitcode.com/tesseract-ocr/tessdata/tree/main

b. 自己在 github上注册一个账号，fork，git ?

c. 偷懒，通过别人下载好的？

d. 改用其他更加方便的 OCR 软件 ?

安装语言包 ?

tessdata各语言集合包解压移动到tessdata文件夹下就可以了

链接： https://blog.csdn.net/weixin_66547608/article/details/134135566

Tesseract最新版语言包chi_sim.traineddata(4.0.0)GitHub官方获取免csdn积分，各个版本语言包全有 << 451MB https://blog.51cto.com/lanzao/3238722

--------------------------------------------------------------------

参考：

Linux平台的OCR软件：gImageReader https://zhuanlan.zhihu.com/p/363329552

从头开始训练自己的 Tesseract 5 LSTM 识别库（超详细） https://zhuanlan.zhihu.com/p/643532806

OCR工具对比与tesseract简明教程 https://zhuanlan.zhihu.com/p/58362904

=======================================

摘录：Tesseract-OCR中文语言包缺失的解决办法

https://blog.csdn.net/weixin_43031092/article/details/105561486

介绍

Tesseract-OCR 5.0的win安装包即使选中中文也会出现无法安装中文的状况，官方文档给出的解释是自己下载语言包即可，但是github下载整个仓库实在是太庞大了（注：在 github上，通过网页下载的办法，是无法单独下载一个指定的语言包的。github 只有全部打包下载的功能？），因此这里单独git中文语言包。
后来git Github的时候发现还是很慢，于是转站码云。

如果你懒的操作，我也做好了压缩包，直接拿走不谢
https://download.csdn.net/download/weixin_43031092/12331633

但是有一个问题就是码云上的数据是就的怎么办？
很简单，把下图中的网址换成官方的：
https://github.com/tesseract-ocr/tessdata.git
缺点就是github网速慢！！！

原文链接：https://blog.csdn.net/weixin_43031092/article/details/105561486

摘录：使用Tesseract做文字识别（OCR）

https://zhuanlan.zhihu.com/p/110647131

命令行运行：（指定简体中文）

tesseract 5.png stdout -l chi_sim

摘录：Tesseract-OCR下载和安装,Python-OCR使用

https://blog.csdn.net/qq_38463737/article/details/109679007

可进入官网直接下载对应语言包，下载完成后放到Tesseract-OCR\tessdata下即可

https://github.com/tesseract-ocr/tessdata

这里的语言包比较久，但暂时没有发现最新语言包在那下载，可以先用用

tesseract-ocr / tesseract

https://github.com/tesseract-ocr/tesseract

Tesseract documentation https://tesseract-ocr.github.io/tessdoc/Home.html

Languages/Scripts supported in different versions of Tesseract https://tesseract-ocr.github.io/tessdoc/Data-Files-in-different-versions.html

https://packages.debian.org/unstable/main/gimagereader

摘录：在 debian 官方仓库中的 OCR软件

gImageReader

https://github.com/manisandro/gImageReader

gImageReader << 2024 最近更新
Graphical GTK+ front-end to tesseract-ocr
gImageReader is a simple front-end to tesseract-ocr. Tesseract is probably
the most accurate open source optical character recognition (OCR) software and
can recognize text in over 60 languages.

gimagereader-qt5
Graphical Qt 5 front-end to tesseract-ocr

------

https://gstreamer.freedesktop.org

GStreamer OpenCV plugins
------

Cuneiform

multi-language OCR system << released on 2011-04-19

http://launchpad.net/cuneiform-linux/
Cuneiform is an OCR system. In addition to text recognition it also does
layout analysis and text format recognition.

------

GOCR << 2018 最近更新

Command line OCR
This is a multi-platform OCR (Optical Character Recognition) program.

OCR技术的10个开源框架，让你快速构建OCR应用

https://baijiahao.baidu.com/s?id=1768094058432529500

OCR技术是一种将图像中的文本信息转换为可编辑文本的技术。随着人工智能技术的快速发展，越来越多的 OCR 开源框架被开发出来，使得 OCR 技术的应用变得更加便捷和高效。下面介绍10个优秀的 OCR 开源框架，让你快速构建 OCR 应用。

1. Tesseract

Tesseract 是 Google 开发的 OCR 引擎，支持多种语言的文本识别，包括英语、中文、日语等。该引擎基于 LSTM 模型，具有高精度和良好的可扩展性，是目前最流行的 OCR 引擎之一。

2. OCRopus

OCRopus 是一款基于 Python 的 OCR 引擎，支持多种语言的文本识别，包括中文、日语、韩语等。该引擎具有高精度和良好的可扩展性，可以轻松地集成到不同的应用中。

3. Kraken

Kraken 是一款基于 Python 的 OCR 引擎，支持多种语言的文本识别。该引擎基于 LSTM 模型，具有高精度和良好的可扩展性，可以轻松地集成到不同的应用中。

4. EasyOCR

EasyOCR 是一款基于 Python 的 OCR 引擎，支持多种语言的文本识别，包括中文、日语、韩语等。该引擎具有高精度和良好的可扩展性，可以轻松地集成到不同的应用中。

5. GOCR

GOCR 是一款开源的 OCR 引擎，支持多种语言的文本识别，包括英语、中文、日语等。该引擎具有高精度和良好的可扩展性，可以轻松地集成到不同的应用中。

6. CuneiForm

CuneiForm 是一款开源的 OCR 引擎，支持多种语言的文本识别，包括英语、中文、日语等。该引擎具有高精度和良好的可扩展性，可以轻松地集成到不同的应用中。

7. Asprise OCR

Asprise OCR 是一款商业化的 OCR 引擎，但也提供了免费的 OCR SDK，支持多种语言的文本识别。该引擎具有高精度和良好的可扩展性，并且提供了丰富的 API 接口，方便开发者集成。

8. OCRopus4

OCRopus4 是 OCRopus 的升级版，支持多种语言的文本识别，包括中文、日语、韩语等。该引擎基于 LSTM 模型，具有高精度和良好的可扩展性，可以轻松地集成到不同的应用中。

9. OpenCV

OpenCV 是一款开源的计算机视觉库，也可以用于 OCR 技术的开发。OpenCV 提供了多种图像处理和分析的工具，可以用于提高 OCR 引擎的识别精度。

10. DeepOCR

DeepOCR 是一款基于深度学习的 OCR 引擎，支持多种语言的文本识别。该引擎基于 CNN 和 LSTM 模型，具有高精度和良好的可扩展性，可以轻松地集成到不同的应用中。

综上所述，OCR 技术的应用变得更加便捷和高效，得益于越来越多的 OCR 开源框架的发展。这些框架不仅可以提高 OCR 引擎的识别精度，而且可以轻松地集成到不同的应用中，为用户提供更优质的服务。关键词：OCR 技术、开源框架、Tesseract、OCRopus、Kraken、EasyOCR、GOCR、CuneiForm、Asprise OCR、OCRopus4、OpenCV、DeepOCR。

如果有任何疑问可以随时评论留言或私信我，欢迎关注我[点击关注]，共同探讨。