基于卷积神经网络的手写汉字识别[matlab版本][可识别509类汉字]

基于卷积神经网络的手写汉字识别[matlab版本][可识别509类汉字]一、数据集的获取数据集的获取来自模式识别国家重点实验室共享,这个不解释直接上网址http://www.nlpr.ia.ac.cn/databases/download/feature_data/HWDB1.1trn_gnt.zip此外还有一些别的数据集,一起列出来,留着以后用行为分析数据库三维人脸数据库中文语言资

F-D

18838人浏览 · 2017-04-22 21:24:23

F-D · 2017-04-22 21:24:23 发布

基于卷积神经网络的手写汉字识别[matlab版本][可识别509类汉字]

####一、数据集的获取
数据集的获取来自模式识别国家重点实验室共享,这个不解释直接上网址http://www.nlpr.ia.ac.cn/databases/download/feature_data/HWDB1.1trn_gnt.zip
此外还有一些别的数据集,一起列出来,留着以后用

行为分析数据库
三维人脸数据库
中文语言资源库
虹膜库数据

下载完之后你会得到这个,一个1.78G的zip压缩包,注意是ZIP的

这里写图片描述

然后你试着解压,对的

然后你会的到一个1.78G的alz文件,没错,里面还是有一层的.你在想,我去,什么是ALZ.要骂人了,淡定

这里写图片描述

然后你仍然没有放弃,发扬不折不挠的精神去百度什么是ALZ,原来是个压缩包,没事下载解压软件去解压,

这里写图片描述

你安装了这个ALZ的解压软件

然后解压
然后你得到了

这里写图片描述

对没错,你得到了一堆GNT格式的文件,然后依靠残存的一点修养去百度,发现,这是一种神奇的压缩格式,基本意思就是,前面几个字节是图像的标签,然后接下来若干字节是对应的图片,然后接下来是标签,然后是图,你要疯了,然后去网上找解决方案,然后找到了
Gnt转npy的python代码,然后再去找npy转mat的代码

然后开始运行,运行了2个小时后,突然报错了,你的电脑内存不足,原来你用来了32位的python,软件可以调用的内存只有2G 明显不够,然后你就换python,然后大概跑;了几个小时终于又报错了.然后接着跑,经过坚持不懈的努力,终于搞定了,然后得到了,提取出来了96000张图片,

这里写图片描述