
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
开源的文字转人声的大模型【输出】
由 Google Brain 团队开发的端到端的文本到语音合成模型。它使用深度学习技术,将输入的文本转换为自然流畅的语音输出。GitHub 仓库:https://github.com/NVIDIA/tacotron2。
开源的文字转人声的大模型【输出】
由 Google Brain 团队开发的端到端的文本到语音合成模型。它使用深度学习技术,将输入的文本转换为自然流畅的语音输出。GitHub 仓库:https://github.com/NVIDIA/tacotron2。
较好的开源语音大模型【输入】
由 Mozilla 开发的开源语音识别(ASR)引擎。它基于深度学习技术,使用大量的语音数据进行训练,可以在多种语言和平台上运行。GitHub 仓库:https://github.com/mozilla/DeepSpeech。
到底了







