语音合成相关论文及代码整理

对重要的语音合成论文及代码进行更新和记录（持续更新）一、论文1、tts 前端2、expressive tts3、voice clone/conversion4、vocoder二、代码1、https://github.com/PaddlePaddle/PaddleSpeech完整的语音识别（流式）、语音合成（流式）、声纹识别、声音分类的工程库2、..................

Zero_to_zero1234

1140人浏览 · 2022-05-23 22:34:19

Zero_to_zero1234 · 2022-05-23 22:34:19 发布

对重要的语音合成论文及代码进行更新和简单记录（持续更新）

一、论文

1、tts 前端
TN：https://github.com/thuhcsi/FlatTN
韵律：https://github.com/thuhcsi/SpanPSP（包含代码和预训练模型）

2、expressive tts
https://arxiv.org/pdf/2205.04421.pdf NaturalSpeech论文，首次达到人声水平

3、voice clone/conversion

4、vocoder

5、speech enhancement

二、代码

1、https://github.com/PaddlePaddle/PaddleSpeech
完整的语音识别（流式）、语音合成（流式）、声纹识别、声音分类的工程库
2、https://github.com/spotify/basic-pitch basicpitch 一个音高生成算法，支持人声、乐器和其他声音，还有交互体验界面，支持拖动和录音直接转出midi https://basicpitch.spotify.com/
3、https://github.com/r9y9/nnsvs 歌声合成库[文档：https://r9y9.github.io/nnsvs/mdn.html]歌声合成库，包含了一些基础的模块，如音高提取和预训练模型等
4、https://github.com/microsoft/NeuralSpeech/tree/master/LightSpeech 轻量化语音合成 rtf = 0.006，相当快
5、https://github.com/dengxiuqi/ChineseLyrics 中文歌词数据库
6、https://github.com/SungFeng-Huang/Meta-TTS 少量语音克隆方法，基于 meta-learning
7、https://github.com/CMsmartvoice/One-Shot-Voice-Cloning UTTS实现一句话语音克隆，包含代码和论文
8、https://github.com/facebookresearch/denoiser 对底噪特别大，干扰噪声多的数据有很好的降噪效果
9、https://github.com/WenzheLiu-Speech/awesome-speech-enhancement 语音增强的论文和代码集合
10、https://github.com/Anjok07/ultimatevocalremovergui 语音分离客户端 uvr5