logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

语音识别之语音激活(VAD)检测(一)

VAD技术在语音领域中应用非常的广泛,在语音识别中我们可以对长语音通过VAD来检测出语音信号的空隙,通过这个空隙来分割语音,将长语音切分成短语音来进行语音识别。在电话通信中,为了减少存储数据所使用的空间,我们可以通过VAD技术将空隙的语音信号进行移除。函数,可以通过声音信号能量的强弱来判断是否有人说话,从而根据语音的空隙来分割音频,这对于一段长语音的音频做分割时非常重要的,通常ASR模型是无法一次

文章图片
#语音识别#人工智能
通过数据可视化来分析分类问题

刚开始面对数据的时候,我们需要考虑数据的一些特性。通过熟悉数据集的特性,有利于方便和确定后续的模型训练和开发,通过这篇文章你能够学习到:1、如何来检查数据2、异常值的检测2、使用平行坐标图来寻找重要属性3、通过可视化来寻找属性和标签的关系数据集使用的是UCI提供的一个岩石和水雷的分类数据,数据集中的特征值代表声呐接收器在不同地点接受到的返回信号,一半数据返回的声呐信号表示的是岩石,一半表示的是水雷

怎么提交项目到github

一、注册账号GitHub官网地址:https://github.com注意:安装TortoiseGit之前需要先安装git,安装TortoiseGit的语言安装包,需要在安装TortoiseGit之后安装。二、安装git下载地址:https://git-scm.com/三、安装TortoiseGit下载地址:https://tortoisegit.org/download/

卷积神经网络LeNet5结构

LeNet5可以说是最早的卷积神经网络了,它发表于1998年,论文原文Gradient-Based Learning Applied to Doucment Recognition作者是Yann Le Cun等。下面对LeNet5网络架构进行简单的说明,有兴趣的同学可以去参考原文,论文原文地址http://yann.lecun.com/exdb/publis/pdf/lecun-01a.pdf。

c++编译错误error C3861: “xxxx”: 找不到标识符

错误描述在导入自定义的头文件时,报C3861 “_ReturnAddress”: 找不到标识符错误,错误信息如下解决办法在自定义的头文件前面导入,指向的头文件即可include ""//自定义头文件include <ppltasks.h>参考:https://zhuanlan.zhihu.com/p/26600794...

如何在visual studio下编译zxing cpp,以及zxing c++的使用

刚开始请允许我发一下牢骚,刚开始学c++,然后,在使用zxing c++解析二维码的时候,需要找资料。但是,我所找的资料都有问题,下载zxing cpp之后,编译的时候各种问题,当时头都大了。而且,网上关于zxing c++二维码解析的资料甚少,都是Java的。所以,当时我就想着,如果弄好了这个,我一定要详细记录一下。zxing cpp在visual studio 2013下的编译:一、下...

数据可视化之箱线图详解

一、箱线图箱线图(Box-plot)又称盒须图、盒式图或箱形图,是一种用作显示一组数据分散情况资料的统计图,在数据分析中经常被使用到,可以被用于异常值的检测。通过箱线图可以很容易找到数据中的异常值。二、使用python绘制箱线图数据集地址:http://archive.ics.uci.edu/ml/machine-learning-databases/abalone/abalone.data1、未

使用tensorflow构建一个卷积神经网络

一、卷积神经网络卷积神经网络(Convolutional Neural Network,CNN)是一种前馈神经网络,它的人工神经元可以响应一部分覆盖范围内的周围单元,对于大型图像处理有出色表现,主要包括卷积层(convolutional layer)和池化层(pooling layer),主要应用于图像、视频、时间序列信号、音频信号、文本数据等。一般的卷积神经网络都是由多个卷积层组成,每个卷积层主

    共 107 条
  • 1
  • 2
  • 3
  • 11
  • 请选择