logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

201912一种改进动物音频分类的数据增强方法

Data augmentation approaches for improving animal audio classification标题:一种改进动物音频分类的数据增强方法作者: Loris Nanni, Michelangelo Paci链接:https://arxiv.org/abs/1912.07756本文利用卷积神经网络(CNNs)训练中不同的数据增强技术,提出了一组用于动...

强烈推荐----现代机器学习技术导论--清华大学王东

http://166.111.134.19:7777/mlbook/2016年7月到8月,王东老师在CSLT组织了一次关于机器学习的内部暑期研讨班。主要目的不是细致 讨论各种具体算法,而是将各种看似高深的方法有机组织起来,告诉学生们每种方法 的基本思路、基本用法及与其它技术的关联,帮助 其走入机器学习的宏伟殿堂。除了王东老师讲以外,还有冯洋、王彩霞、王卯宁 三位老师,分别讲述图模型、核方法和遗..

pytorch 最简单示例

# 来自B站刘二大人import torchx_data = torch.Tensor([[1.0], [2.0], [3.0]])y_data = torch.Tensor([[2.0], [4.0], [6.0]])class LinearModel(torch.nn.Module):def __init__(self):super(LinearModel, self).__init__()s

2018.10.12--人工智能第一次作业---动物专家系统(1)

参考链接:https://blog.csdn.net/shaguabufadai/article/details/71699372https://blog.csdn.net/qq_40276310/article/details/80329261#commentseditimport sysfeatures = ["", &amp

#人工智能
20180528 timit数据集下载地址

可以从下面链接下载timit数据集的一部分,总共应该400多兆,这里只有40多兆,只有一部分也可以。我们可以看看格式。这里只有38个说话人,也就是38个文件夹。https://download.csdn.net/download/weixin_41864878/10585377TIMIT全称The DARPA TIMIT Acoustic-Phonetic Continuous Speech ..

20190425

1e-10是C/C++规定的浮点数的科学计数写法,意思是1.0x10的-10次方。这个记数法有一些要求,一是e前面整数部分为1位的浮点数,如1.0、3.3、9.999978901等(但不按这个规则写,如123.4E-3编译器也认可);二时e可以大写也可以小写;三是e后面紧跟带符号的十进制整数,长度最大为3位,正数时可不写+号。所以,1.234E-2、1.234e-02、1.234E-002等其实是

关于声纹识别数据集VoxCeleb2下载问题--

voxceleb2 下载:基本就是参考下面这篇:https://blog.csdn.net/weixin_38858860/article/details/83997952可以在linux或者mac上直接用下面命令下载:(这个是下载的vox2的audio部分,声纹识别用的)用户名和密码需要自己去申请,很容易。剩下的就看网速了。建议用自己家宽带下载。wget http://www.ro...

linux如何只复制目录结构而不复制数据

find . -type d -exec mkdir -p /data/datasets/musan1/{} ;在当前目录下找类型为d的文件(即目录类型),然后执行后面的操作。当前目录是你要copy的文件夹,-p后面接的目的文件夹...

dan-povery大神的kaldi入门ppt

语音识别大神dan-povery介绍kaldi的ppt,虽然时间有点早,但是内容都很基础,kaldi新手入门必看,有讲kaldi中数据的一般格式和语音识别的一般流程。下载地址:here我想重点截两张图,介绍的是kaldi中输入输出的命令行语法,什么是scp和ark有趣的是:whether to read or write,is determined by the program itsel...

20190509

Speech Commands: A Dataset for Limited-Vocabulary Speech Recognition论文下载地址论文阅读笔记:The Linguistic Data Consortium (LDC) is an open consortium of universities, libraries, corporations and government r...

#语音识别
    共 19 条
  • 1
  • 2
  • 请选择