小白羊000 个人主页

@qq_41447652

小白羊000

2023-10-08 14:33:37 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

TTS:访问百度tts完成文本转文字

一、TTS，文本转语音？TTS（text to speech）:文本转语音，即语音生成技术。目的：想通过调用API完成，批量的短音频数据（.wav/mp3）合成音频数据集。用于特定场景的的ASR任务。方法：查找，查找，找到，做记录。方法来源：https://blog.csdn.net/Cykinter/article/details/107215464?utm_medium=distribute.

#自然语言处理 #python

Ubuntu安装ctcdecode库实现beamsearch（pytorch中）

依赖库：openfst-1.6.7.tar.gz、boost_1_67_0.tar.gz第二个会访问失败，这里合并打包到一起百度网盘——提取码：ASDFhttps://pan.baidu.com/s/1sPe_msTRQ9pMZ5O5mMFBhA安装步骤，参见这个项目README，环境安装GitHub - yeyupiaoling/MASR: Pytorch实现的MASR中文语音识别，目前纯CNN

#ubuntu #pytorch

2021-04-27

本文主要为代码整合贡献，主要贡献为参数解释，原理见参考文章。基于python语言，有使用库函数5行解决问题；还有一步步实现搭建50行实现。如何获取39维MFCC信号，即能量 + 12维mfcc信号 + 13维度detla+ 13维detla - detla。39维MFCC信号用与GMM - HMM语音识别。

#python

到底了