kaldi上运行THCHS-30
如何在kaldi 上实现THCHS-30中文语音识别
参考文章:
http://kaldi-asr.org/doc/
https://sourceforge.net/p/kaldi/discussion/
https://shiweipku.gitbooks.io/chinese-doc-of-kaldi
https://sourceforge.net/p/kaldi/discussion/1355348/thread/1ff78ec8/
http://kaldi-asr.org/doc/dnn1.html#dnn1_conversion_to_dnn2
需要安装的:pip install cython
1. 数据准备,/thchs30/README.txt这里面有写,3个压缩包,记得解压。

2.修改/thchs30/s5/run.sh中的"thchs=....."的数据路径。

3.修改/thchs30/s5/cmd.sh 为:

4. 然后执行run.sh,中间遇到过几个小问题,本人ubuntu14.04,修改n=4,我的机器是4核的。 中间如果出现Error,多半是内存不足引起的,8G内存跑不过,24G内存跑过了。
5. 插曲:倒数第二个的dnn模型,需要用gpu进行训练,安装方式网上有。
6.安装portaudio:/tools/下./install_portaudio.sh
7./src/下 , make ext
8.从voxforge把online_demo拷贝到thchs30下,和s5同级,online_demo建online-data和work两个文件夹。online-data下建audio和models,audio放要识别的wav,models建tri1,讲s5下/exp/下的tri1下的final.mdl和35.mdl拷贝过去,把s5下的exp下的tri1下的graph_word里面的words.txt和HCLG.fst也拷过去。
9.以下是跑tri1,注释掉run.sh:

10. 修改run.sh:
ac_model_type=tri2b_mmi 改成ac_model_type=tri1

11.修改run.sh:

12.运行/.run.sh 就可以出现字了,中间如果有问题可以通过提示解决。
13.运行tri2(tri3,tri4同理):把s5下的exp下的tri2b下的12.mat考到models的tri2b下,把final.mat考过来,再拷贝其他相应的文件,修改,

14.修改run.sh:添加--left-context=3 --right-context=3,运行即可:

15.运行dnn:首先要将nnet1转成nnet2,如何转换,上面的文章里有,再贴一下链接:http://kaldi-asr.org/doc/dnn1.html#dnn1_conversion_to_dnn2,https://sourceforge.net/p/kaldi/discussion/1355348/thread/1ff78ec8/。
转载自:http://www.jianshu.com/p/22fc9906878f
更多推荐
所有评论(0)