logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

关于声纹识别数据集VoxCeleb2下载问题--

voxceleb2 下载:基本就是参考下面这篇:https://blog.csdn.net/weixin_38858860/article/details/83997952可以在linux或者mac上直接用下面命令下载:(这个是下载的vox2的audio部分,声纹识别用的)用户名和密码需要自己去申请,很容易。剩下的就看网速了。建议用自己家宽带下载。wget http://www.ro...

linux如何只复制目录结构而不复制数据

find . -type d -exec mkdir -p /data/datasets/musan1/{} ;在当前目录下找类型为d的文件(即目录类型),然后执行后面的操作。当前目录是你要copy的文件夹,-p后面接的目的文件夹...

dan-povery大神的kaldi入门ppt

语音识别大神dan-povery介绍kaldi的ppt,虽然时间有点早,但是内容都很基础,kaldi新手入门必看,有讲kaldi中数据的一般格式和语音识别的一般流程。下载地址:here我想重点截两张图,介绍的是kaldi中输入输出的命令行语法,什么是scp和ark有趣的是:whether to read or write,is determined by the program itsel...

20190509

Speech Commands: A Dataset for Limited-Vocabulary Speech Recognition论文下载地址论文阅读笔记:The Linguistic Data Consortium (LDC) is an open consortium of universities, libraries, corporations and government r...

#语音识别
20190603--Talk is cheap,show me your code!

今天终于跑通了tensorflow语音识别的官方例子,就是这个:https://blog.csdn.net/yj13811596648/article/details/90637656原来,之前是cuda没装好,gpu的版本和cuda的版本也没有对上,cudnn也没装,后来阴差阳错弄好了以后我就想着能不能再试试。结果改好目录,直接运行train.py就开始训练了。原来是十个命令,18000步,..

语音识别入门资源

语音识别技术的前世今生之前世https://blog.csdn.net/Tonywu2018/article/details/84678122语音识别技术的前世今生之今生https://blog.csdn.net/Tonywu2018/article/details/84679628《语音识别的前世今生:GMM+HMM & 深度学习》讲座笔记https://www.cnblogs.

#语音识别
tensorflow官方语音识别例子中的input_data.py---孤立词识别

下面是官方对这个例子的介绍:https://www.tensorflow.org/tutorials/sequences/audio_recognition下面是input_data.py官方源代码:https://github.com/yilunjiangyueming/tensorflow/blob/master/tensorflow/examples/speech_commands/i...

#语音识别#tensorflow
HMM 语音识别小例子--by python--孤立词识别

找了半天,才找到一个,链接如下:使用python建立HMM-GMM孤立词识别模型里面有代码链接,还有hmmlearn的文档链接。还是再贴一下文档链接吧,便于自己查找。hmmlearn文档这个例子使用的训练和测试语音,好像是德语的1到10,不是德语也无所谓啦,反正就是某种语言的1到10.这个官方文档里的小例子也很简单,专门贴出来解释一下:hmm小例子首先我们要明白它要解决什么问题,是H...

使用GMMs进行语音性别检测--你的第一个语音识别小例子

原文地址:Voice Gender Detection using GMMs : A Python Primer数据集下载:翻译版下载:

#语音识别
kaldi中的egs文件夹中的demo都是干什么的

这里只是简单记录下,如果你需要哪个,请细看每个文件夹里面的README。aishell:里面有两文件夹,S5是一种语音识别方法的demo,V1是一种说话人识别的demo。数据用的就是aishell1。aishell2:只有S5,也就是语音识别。ami:The AMI Meeting Corpus,只有S5和S5b,都是语音识别,S5b应该是在S5方法的基础上有所改良。an4...

    共 13 条
  • 1
  • 2
  • 请选择