对重要的语音合成论文及代码进行更新和简单记录(持续更新)

一、论文

1、tts 前端
TN:https://github.com/thuhcsi/FlatTN
韵律:https://github.com/thuhcsi/SpanPSP(包含代码和预训练模型)

2、expressive tts
https://arxiv.org/pdf/2205.04421.pdf NaturalSpeech论文,首次达到人声水平

3、voice clone/conversion

4、vocoder

5、speech enhancement

二、代码

1、https://github.com/PaddlePaddle/PaddleSpeech
完整的 语音识别(流式)、语音合成(流式)、声纹识别、声音分类 的工程库
2、https://github.com/spotify/basic-pitch basicpitch 一个音高生成算法,支持人声、乐器和其他声音,还有交互体验界面,支持拖动和录音直接转出midi https://basicpitch.spotify.com/
3、https://github.com/r9y9/nnsvs 歌声合成库[文档:https://r9y9.github.io/nnsvs/mdn.html]歌声合成库,包含了一些基础的模块,如音高提取和预训练模型等
4、https://github.com/microsoft/NeuralSpeech/tree/master/LightSpeech 轻量化语音合成 rtf = 0.006,相当快
5、https://github.com/dengxiuqi/ChineseLyrics 中文歌词数据库
6、https://github.com/SungFeng-Huang/Meta-TTS 少量语音克隆方法,基于 meta-learning
7、https://github.com/CMsmartvoice/One-Shot-Voice-Cloning UTTS实现一句话语音克隆,包含代码和论文
8、https://github.com/facebookresearch/denoiser 对底噪特别大,干扰噪声多的数据有很好的降噪效果
9、https://github.com/WenzheLiu-Speech/awesome-speech-enhancement 语音增强的论文和代码集合
10、https://github.com/Anjok07/ultimatevocalremovergui 语音分离客户端 uvr5

Logo

CSDN联合极客时间,共同打造面向开发者的精品内容学习社区,助力成长!

更多推荐