kaldi上运行THCHS-30

如何在kaldi 上实现THCHS-30中文语音识别

HalFTeen

5620人浏览 · 2017-05-01 14:27:10

HalFTeen · 2017-05-01 14:27:10 发布

参考文章：

http://kaldi-asr.org/doc/

https://sourceforge.net/p/kaldi/discussion/

https://shiweipku.gitbooks.io/chinese-doc-of-kaldi

https://sourceforge.net/p/kaldi/discussion/1355348/thread/1ff78ec8/

http://kaldi-asr.org/doc/dnn1.html#dnn1_conversion_to_dnn2

需要安装的：pip install cython

1. 数据准备,/thchs30/README.txt这里面有写，3个压缩包，记得解压。

2.修改/thchs30/s5/run.sh中的"thchs=....."的数据路径。

3.修改/thchs30/s5/cmd.sh 为：

4. 然后执行run.sh，中间遇到过几个小问题，本人ubuntu14.04，修改n=4，我的机器是4核的。中间如果出现Error，多半是内存不足引起的，8G内存跑不过，24G内存跑过了。

5. 插曲：倒数第二个的dnn模型，需要用gpu进行训练，安装方式网上有。

6.安装portaudio：/tools/下./install_portaudio.sh

7./src/下 , make ext

8.从voxforge把online_demo拷贝到thchs30下，和s5同级，online_demo建online-data和work两个文件夹。online-data下建audio和models，audio放要识别的wav，models建tri1，讲s5下/exp/下的tri1下的final.mdl和35.mdl拷贝过去，把s5下的exp下的tri1下的graph_word里面的words.txt和HCLG.fst也拷过去。

9.以下是跑tri1,注释掉run.sh:

10. 修改run.sh:

ac_model_type=tri2b_mmi 改成ac_model_type=tri1

11.修改run.sh：

12.运行/.run.sh 就可以出现字了，中间如果有问题可以通过提示解决。

13.运行tri2(tri3,tri4同理)：把s5下的exp下的tri2b下的12.mat考到models的tri2b下，把final.mat考过来，再拷贝其他相应的文件，修改，

14.修改run.sh:添加--left-context=3 --right-context=3，运行即可：

15.运行dnn：首先要将nnet1转成nnet2，如何转换，上面的文章里有，再贴一下链接：http://kaldi-asr.org/doc/dnn1.html#dnn1_conversion_to_dnn2，https://sourceforge.net/p/kaldi/discussion/1355348/thread/1ff78ec8/。

转载自：http://www.jianshu.com/p/22fc9906878f

点击阅读全文

CSDN学习社区

CSDN联合极客时间，共同打造面向开发者的精品内容学习社区，助力成长！

更多推荐

嵌入式作业（七）：基于Ardunio的STM32串口通信

嵌入式作业（七）0作业要求1Ardunio 完成STM32的串口通信（1）安装Ardunio IDE（2）stm32串口通信2关于 stduino IDE0作业要求安装 Ardunio IDE 和相关软件支持库，在Ardunio 完成STM32板子的串口通信程序：（1）持续向串口输出“Hello world！”；（2）当接收到“stop!”时，停止输出。网上有一个国人版的MCU集成开发平台， st

CSDN学习社区

JDBC详解

JDBC文章目录JDBC什么是JDBC?JDBC驱动程序:Java使用JDBC访问数据库的步骤:设置classpath:Oracle连接字符串的书写格式:简单的例子:常用数据库的驱动程序及JDBC URL:Oracle数据库:SQL Server数据库MySQL数据库Access数据库PreparedStatement接口:JNDI-数据源（Data Source）与连接池（Connection

CSDN学习社区

“模式识别与机器学习”学习笔记no2.再谈感知机

接**上篇：上篇主要进行了PLA，Pocket算法的理论过程分析和在给定数据集上利用pocket算法对数据集进行分类学习，得到错分数量最少的分类面。上篇中pocket算法的过程已经进行了编程和测试，框架已经建立了起来，这一篇主要上篇中没有提到或涉及不深的几个问题。1.数据集的构造。上篇是直接使用了题目给的向量，这次来根据正态分布来产生数据集。np.random.normal函数可以根据均值和方差生