
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
TTS:访问百度tts完成文本转文字
一、TTS,文本转语音?TTS(text to speech):文本转语音,即语音生成技术。目的:想通过调用API完成,批量的短音频数据(.wav/mp3)合成音频数据集。用于特定场景的的ASR任务。方法:查找,查找,找到,做记录。方法来源:https://blog.csdn.net/Cykinter/article/details/107215464?utm_medium=distribute.
Ubuntu安装ctcdecode库实现beamsearch(pytorch中)
依赖库:openfst-1.6.7.tar.gz、boost_1_67_0.tar.gz第二个会访问失败,这里合并打包到一起百度网盘——提取码:ASDFhttps://pan.baidu.com/s/1sPe_msTRQ9pMZ5O5mMFBhA安装步骤,参见这个项目README,环境安装GitHub - yeyupiaoling/MASR: Pytorch实现的MASR中文语音识别,目前纯CNN

2021-04-27
本文主要为代码整合贡献,主要贡献为参数解释,原理见参考文章。基于python语言,有使用库函数5行解决问题;还有一步步实现搭建50行实现。如何获取39维MFCC信号,即 能量 + 12维mfcc信号 + 13维度detla+ 13维detla - detla。39维MFCC信号用与GMM - HMM语音识别。
到底了







