SPPAS自动对齐软件的介绍安装和使用

最近一直在自主学习连续语音识别的相关知识，也着手开始动手自己做一些列的实验。实验过程中需要采集自己需要的语料数据，但是发现采集之后标注确实是个问题，单纯使用praat逐个词的将音素也标注出来，实在是费时费力，所以经过这几天与同学的讨论和搜集资料，找到一个叫SPPAS的自动对齐标注软件，通过实验，基本满足我的需求，下面给大家介绍一下。SPPAS介绍：这个软件是法国人搞的，所以毋庸置疑

JamesJuZhang

6348人浏览 · 2014-01-27 12:07:52

JamesJuZhang · 2014-01-27 12:07:52 发布

最近一直在自主学习连续语音识别的相关知识，也着手开始动手自己做一些列的实验。实验过程中需要采集自己需要的语料数据，但是发现采集之后标注确实是个问题，单纯使用praat逐个词的将音素也标注出来，实在是费时费力，所以经过这几天与同学的讨论和搜集资料，找到一个叫SPPAS的自动对齐标注软件，通过实验，基本满足我的需求，下面给大家介绍一下。

SPPAS介绍：

这个软件是法国人搞的，所以毋庸置疑，对于法语的标注效果最好。当然软件同样支持英文，中文等十种语言。软件中会有每种语言所训练好的语法字典以及声学模型，我只是测试了中文和英文的标注，效果挺不错的，基本能够保证一般的需求，也就是将文本标注成词级别和音素级别。

SPPAS下载：

官方的下载网址是：http://aune.lpl.univ-aix.fr/~bigi/sppas/download.php

SPPAS安装：

在安装SPPAS之前，需要先事先安装好以下的部分：

Python
wxPython
sox
Julius

具体的安装步骤和方法，官方的网址会有详细的指导：http://aune.lpl.univ-aix.fr/~bigi/sppas/installation.php

注：这里需要注意的一点是SPPAS的安装路径要在英文目录下，一开始我安装忽略了这一点，安装之后使用不了，总是报错误，后来才发现，安装的路径中有中文。

SPPAS使用：

安装好之后我们打开就能看到初始化的界面：

下面我们就可从尝试标注了：

例：

我们对wav文件进行标注，我们需要wav文件以及所对应的同名的txt文件，txt中的内容与wav内容对应。如：000.wav中的内容为“zero”，我们要在000.txt文件中写入“zero”，值得注意的是如果是一句话的话，里面涉及的停顿部分我们使用#来隔开，以帮助其找到分界点。

准备工作搞定之后我们添加文件：

然后在右面根据我们的需要选择：

注：最下两个选项貌似只支持法语和意大利语，不使用的时候不要选择。

然后选中wav，点击右面最下面的开始标注：

搞定之后会出现相应的日志：

然后我们查看文件夹下：

这是标注好的结果，一般merge.TextGrid就是我们需要的部分，我们可以使用praat来进行查看：

以上就是SPPAS自动对齐软件的介绍安装和使用。

CSDN学习社区

CSDN联合极客时间，共同打造面向开发者的精品内容学习社区，助力成长！

更多推荐

cover

用 OpenAI Assistants 做大模型应用开发

CSDN学习社区

cover

1 小时解读鸿蒙 10 大热点问题

CSDN学习社区

cover

1 小时解读鸿蒙 10 大热点问题

CSDN学习社区

所有评论(0)

查看更多评论

JamesJuZhang

已为社区贡献22条内容