语音识别SpeechRecognition中文包对应文件名的处理

背景:win8.1, python 3.9.7 自带idle, 模块SpeechRecognition-3.8.(pip install SpeechRecognition安装默认版本)现象:1. 在网站CMU Sphinx - Browse /Acoustic and Language Models/Mandarin at SourceForge.net下载cmusphinx-zh-cn-5.2

work-harder

4501人浏览 · 2022-03-06 13:32:58

work-harder · 2022-03-06 13:32:58 发布

背景:

win8.1, python 3.9.7 自带idle, 模块SpeechRecognition-3.8.(pip install SpeechRecognition安装默认版本)

现象:

1. 在网站 CMU Sphinx - Browse /Acoustic and Language Models/Mandarin at SourceForge.net

下载cmusphinx-zh-cn-5.2.tar.gz后，发现包中的文件/文件夹名字和模块自带的en-US文件夹下的文件/文件夹不同名。
CMU Sphinx - Browse /Acoustic and Language Models/Mandarin at SourceForge.netSpeech Recognition Toolkithttps://sourceforge.net/projects/cmusphinx/files/Acoustic%20and%20Language%20Models/Mandarin/2. 在尝试运行练习小程序后，发现有错误提示，说找不到文件或文件夹。

解决办法:

1. 在en-US同目录下建立一个 zh-CN文件夹

2. 把cmusphinx-zh-cn-5.2.tar.gz解压后的文件/文件按照en-US中的文件/文件夹命名。其中readme 可以不更改为License.

3. 运行后，中文正常输出。(有的中文还是辨认不出来。和是否能运行无关了)

4. 小程序和图片附在这里，方便参考。

5.语音文件，可以自己录制一个 demo_audio.wav，也可以找一个简单一点的

附件:

1. 中文语言包解压后的内容

2. 模块自带英文语言包内容

3. 语音识别小程序

# speech_recognition的安装: pip install SpeechRecognition

import speech_recognition as sr

audio_file = "demo_audio.wav"

r = sr.Recognizer()

#打开语音文件，放在本目录下
with sr.AudioFile(audio_file) as source:
    audio = r.record(source)


#将语音文件内容转换为文本
print("文本内容:",r.recognize_sphinx(audio,language="zh-CN"))