Python 深度学习AI - 声音克隆、声音模仿、模拟特朗普声音唱《See You Again》，Real-Time-Voice-Cloning项目的安装与使用

Python 深度学习AI - 声音克隆、声音模拟第一章：环境准备与安装① Real-Time-Voice-Cloning 项目源码下载② requirments 必要库安装③ TensorFlow 安装④ PyTorch 安装⑤ FFmpeg 下载环境变量配置⑥ 下载训练包第二章：效果测试① 命令行合成音频测试：输入音频源和文本，合成目标② 工具箱合成音频测试，工具箱的使用方法介绍③ 特朗普声音

挣扎的蓝藻

16146人浏览 · 2021-08-09 22:01:26

挣扎的蓝藻 · 2021-08-09 22:01:26 发布

第一章：环境准备与安装

① Real-Time-Voice-Cloning 项目源码下载

获取地址：
github 官方
 小蓝枣的 csdn 资源仓库
在这里插入图片描述

② requirments 必要库安装

在这里插入图片描述
清单如下：

umap-learn
visdom
librosa>=0.8.0
matplotlib>=3.3.0
numpy==1.19.3; platform_system == “Windows”
numpy==1.19.4; platform_system != “Windows”
scipy>=1.0.0
tqdm
sounddevice
SoundFile
Unidecode
inflect
PyQt5
multiprocess
numba
webrtcvad; platform_system != “Windows”

使用命令 pip install -r requirements.txt 进行安装。
在这里插入图片描述

③ TensorFlow 安装

TensorFlow 官方网站
在这里插入图片描述

④ PyTorch 安装

PyTorch 官方网站
在这里插入图片描述
安装命令：pip install torch==1.8.0+cpu torchvision==0.9.0+cpu torchaudio==0.8.0 -f https://download.pytorch.org/whl/torch_stable.html

⑤ FFmpeg 下载环境变量配置

github 官方
在这里插入图片描述
环境变量配置：

⑥ 下载训练包

获取地址：
github 官方在这里插入图片描述

将训练包直接解压到项目根目录下。

第二章：效果测试

① 命令行合成音频测试：输入音频源和文本，合成目标

由于官方提供的训练库是英文版的，所以如果音频源是中文，或者合成中文内容效果不是很好，大家有兴趣的可以找一些中文训练包来进行测试。
在这里插入图片描述

这是项目里给的声音源示例，可以用这个来进行测试。

合成后的音频文件。

② 工具箱合成音频测试，工具箱的使用方法介绍

在这里插入图片描述
分析后黑色部分合成的不是很好，可以重新再分析一下，每次分析的效果都是不一样的。

③ 特朗普声音克隆，模拟特朗普讲话，特朗普唱《See You Again》

特朗普音频资源获取：
小蓝枣的 csdn 资源仓库
这是歌曲 《We Cant’t Stop》，合成的效果还不错，有的歌涉及断句的，给它加个回车断一下效果会更好，有层次感。
在这里插入图片描述
这是歌曲 《See You Again》，合成的效果也还行。

喜欢的点个赞❤吧！