语音识别无论是接口还是开源的项目,大多情况下都需要将语音格式转化为wav格式。

首先,需要安装pydub库,pip install pydub 就行。

接下来将你需要转化的mp3文件放入文件夹,创建好需要存入的wav文件夹。

接下来python 代码实现 :

from pydub import AudioSegment

import os

def MP32WAV(mp3_path, wav_path):

"""

这是MP3文件转化成WAV文件的函数

:param mp3_path: MP3文件的地址

:param wav_path: WAV文件的地址

"""

MP3_File = AudioSegment.from_mp3(file=mp3_path)

MP3_File.export(wav_path, format="wav")

# MP32WAV('F:/mp3/3.mp3','F:/mp3/3.wav')

def run_main():

# MP3文件和WAV文件的地址

path1 = 'F:/mp3'

path2 = "F:/wav"

paths = os.listdir(path1)

mp3_paths = []

# 获取mp3文件的相对地址

for mp3_path in paths:

mp3_paths.append(path1 + "/" + mp3_path)

# print(mp3_paths)

# 得到MP3文件对应的WAV文件的相对地址

wav_paths = []

for mp3_path in mp3_paths:

print(mp3_path)

wav_path = path2 + "/" + mp3_path[1:].split('.')[0].split('/')[-1] + '.wav'

print(wav_path)

wav_paths.append(wav_path)

print(wav_paths)

# 将MP3文件转化成WAV文件

for (mp3_path, wav_path) in zip(mp3_paths, wav_paths):

# print(mp3_path)

# print(mp3_paths)

MP32WAV(mp3_path, wav_path)

if __name__ == '__main__':

run_main()

转换后得到结果:

Logo

CSDN联合极客时间,共同打造面向开发者的精品内容学习社区,助力成长!

更多推荐