基于卷积神经网络的手写汉字识别[matlab版本][可识别509类汉字]
基于卷积神经网络的手写汉字识别[matlab版本][可识别509类汉字]一、数据集的获取数据集的获取来自模式识别国家重点实验室共享,这个不解释直接上网址http://www.nlpr.ia.ac.cn/databases/download/feature_data/HWDB1.1trn_gnt.zip此外还有一些别的数据集,一起列出来,留着以后用行为分析数据库三维人脸数据库中文语言资
基于卷积神经网络的手写汉字识别[matlab版本][可识别509类汉字]
####一、 数据集的获取
数据集的获取来自模式识别国家重点实验室共享,这个不解释直接上网址http://www.nlpr.ia.ac.cn/databases/download/feature_data/HWDB1.1trn_gnt.zip
此外还有一些别的数据集,一起列出来,留着以后用
- 行为分析数据库
- 三维人脸数据库
- 中文语言资源库
- 虹膜库数据
下载完之后你会得到这个,一个1.78G的zip压缩包,注意是ZIP的
然后你试着解压,对的
然后你会的到一个1.78G的alz文件,没错,里面还是有一层的.你在想,我去,什么是ALZ.要骂人了,淡定
然后你仍然没有放弃,发扬不折不挠的精神去百度什么是ALZ,原来是个压缩包,没事下载解压软件去解压,
你安装了这个ALZ的解压软件
然后解压
然后你得到了
对没错,你得到了一堆GNT格式的文件,然后依靠残存的一点修养去百度,发现,这是一种神奇的压缩格式,基本意思就是,前面几个字节是图像的标签,然后接下来若干字节是对应的图片,然后接下来是标签,然后是图,你要疯了,然后去网上找解决方案,然后找到了
Gnt转npy的python代码,然后再去找npy转mat的代码
然后开始运行,运行了2个小时后,突然报错了,你的电脑内存不足,原来你用来了32位的python,软件可以调用的内存只有2G 明显不够,然后你就换python,然后大概跑;了几个小时终于又报错了.然后接着跑,经过坚持不懈的努力,终于搞定了,然后得到了,提取出来了96000张图片,
虽然不是全部的图,但是勉强能用了吧,然后你就高兴的开始去做训练集,开始训练,然后发现,python输出的标签好像不是汉字是,什么gbk码,我去,然后你就去下载了一份转换
他长这个样子
这个文件的 内心是这样
然后你就高兴的开始搞出一个变量,值是:
角饺缴蜒岩延躲朵跺啊阿埃墨默沫薯暑曙舵绞剿教酵轿较叫窖揭接皆秸街阶截劫节桔杰捷睫竭洁结解姐戒藉芥界借介疥诫届巾筋斤金今津襟紧锦仅谨进靳晋禁近烬浸尽劲荆兢茎睛晶鲸………………………
二、 训练
然后你开心的去训练,
用经典的CNN代码去训练,然后死也出不来结果,
然后经过99-81难你终于成功了,成功来之不易啊.,最终的结果是成功的搞定了500类汉字的识别,捏了一把汗,开始睡觉.天也亮了.
最后放一个训练成功的图
三、 测试网络效果##
然后晚上起床,看看训练好的网络,该让它出来转转了
然后就测试一下吧
最后来个动图让你们看看,效果,csdn不让上传,就随手去找了个图床,会不会挂就看你们的运气了
##附演示的代码:链接: pan.baidu.com/s/1slJOqh3 密码: zi23
挂掉的话请留言.
链接总是挂掉,不补了,去下面的群里获取吧,另外有什么问题可以群里提问交流。
如果群连接失效了
关注
扫描下方二维码或者直接在微信公众号搜索:zhishikf
回复
手写汉字
加我为好友,我拉你群
更多推荐
所有评论(0)