对于做语音识别的人可以看看:

TIMIT数据集是来自美国630个人每个人说十个给定的句子,每一个句子都有标记

TIMIT数据集介绍

如:这篇博客:http://blog.csdn.net/jie8895010/article/details/52425784

格式如下:

ID   <SA>  <-------- SX --------->  <----- SI ----->
;---  ----  -----------------------  ----------------
ABC0  1  2  331   61  241  421  151   781  1620  2041
ABW0  1  2  134  314   44  224  404  1230  1664  2294
ADC0  1  2  287   17  197  377  107   737  1367  1997
ADD0  1  2   88  268  448  178  358   538  1295  1798
ADG0  1  2  199  379  109  289   19   649  1279  1909
AEB0  1  2   90  270  450  180  360   990  1411  2250
AEM0  1  2  312   42  222  402  132   762  1392  2022
AEO0  1  2  246  426  156  336   66  1655  1326  1956
AFM0  1  2   39  219  399  129  309   939  1569  2199
AHH0  1  2  214  394  124  304   34   664  1294  1924
AJC0  1  2  385  115  295   25  205   835  1946  2095

......

......

数据集下载百度网盘:

链接:http://pan.baidu.com/s/1o7YYx9w 

密码:wd6d


Logo

CSDN联合极客时间,共同打造面向开发者的精品内容学习社区,助力成长!

更多推荐