logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

开源的文字转人声的大模型【输出】

由 Google Brain 团队开发的端到端的文本到语音合成模型。它使用深度学习技术,将输入的文本转换为自然流畅的语音输出。GitHub 仓库:https://github.com/NVIDIA/tacotron2。

#人工智能
开源的文字转人声的大模型【输出】

由 Google Brain 团队开发的端到端的文本到语音合成模型。它使用深度学习技术,将输入的文本转换为自然流畅的语音输出。GitHub 仓库:https://github.com/NVIDIA/tacotron2。

#人工智能
较好的开源语音大模型【输入】

由 Mozilla 开发的开源语音识别(ASR)引擎。它基于深度学习技术,使用大量的语音数据进行训练,可以在多种语言和平台上运行。GitHub 仓库:https://github.com/mozilla/DeepSpeech。

#人工智能#机器学习
到底了