
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
这篇文章是Google发布的关于神经网络量化方面的文章,文章地址:https://arxiv.org/abs/1712.05877主要内容摘自:https://www.jianshu.com/p/19467624b4b0有很少的修改介绍Low bits压缩再用于CNN推理当属该下的推理优化技术主流。将本是Float32类型的乘法或乘加计算使用INT8类型来做可一次批量(SIMD...
语音识别技术随着神经网络的兴起和发展,准确率得到了很大的改善,在很多场景下都可以逐步商用落地了,很多公司也组建了语音团队。其实在github上,语音识别相关的项目也是层出不穷,其中的一些项目的质量很高,如果好好借鉴学习的话可以避免从头造轮子,毕竟造轮子也不是那么容易的 = =!。在这里,对一些比较流行的项目做一些汇总和简单介绍。1. ASR1.1 kaldihttps://github.com/k
1.摄像机成像原理成像的过程实质上是4个坐标系的转换。首先空间中的一点由 世界坐标系 转换到 摄像机坐标系 ,然后再将其投影到成像平面 (图像物理坐标系 ) ,最后再将成像平面上的数据转换到图像平面 (图像像素坐标系 ) 。 下文对4个坐标系的 变换做了详细的解释:http://blog.csdn.net/humanking7/article/details
现在大部分的深度学习教程中都把卷积定义为图像矩阵和卷积核的按位点乘。实际上,这种操作亦应该是互相关(cross-correlation),而卷积需要把卷积核顺时针旋转180度然后再做点乘。数学定义:卷积:互相关:在卷积层的反向传播中,其实是需要对前一层的误差(也叫敏感度sensitivity)做padding(补零)然后再和卷积核做真正的卷积操作,也就是需要把卷积核顺时针翻转180度。...
二次型多元函数极值Hessian矩阵正定矩阵如何判断一个矩阵是否是正定的,负定的,还是不定的呢?一个最常用的方法就是顺序主子式。实对称矩阵为正定矩阵的充要条件是的各顺序主子式都大于零。当然这个判定方法的计算量比较大。对于实二次型矩阵还有一个判定方法:实二次型矩阵为正定二次型的充要条件是的矩阵的特征值全大于零。为负定二次型的充要条件是的矩阵的特征值全小于零,否则是不定的。多元函数极值的判定泰勒展开式
神经网络模型的效果及优化的目标是通过损失函数来定义的。1.平方差损失函数平方差函数是最常用的损失函数,也就是L2 loss再除以2。E=12(a−y)2E=12(a−y)2 E=\frac{1}{2}(a-y)^2其中y是我们期望的输出,a为神经元的实际输出 (a=σ(Wx+b)a=σ(Wx+b)a=\sigma(Wx+b), σσ\sigma 是激活函数) 。也就...
转自我的知乎专栏:https://zhuanlan.zhihu.com/p/34378516/edit神经网络模型是人工智能最基础的模型,它的诞生也是受益于神经科学家对猫的大脑的研究。神经网络通过自学习的方式可以获得高度抽象的,手工特征无法达到的特征,在计算机视觉领域取得了革命性的突破。而神经网络之所以最近几年取得了这么大的成功,反向传播算法是一个很重要的原因。可以说,只有深入了解了反向传播算..
docker是个类似虚拟机的东西,但是比虚拟机好用,更轻量级。而且可以直接使用系统硬件,比如gpu。在很多时候,如果有一个docker image,可以省去很多配置环境,安装依赖包等的繁琐工作。docker的简单教程:http://www.runoob.com/docker/ubuntu-docker-install.html本文介绍一下在ubuntu 14.04下docker的安装和使用1.
声学模型基本单元常用的声学模型基本单元是单词(Word)、上下文无关音素(Monophone)、上下文相关音素(Triphone,Biphone)和音节(Syllable)。Monophone 模型具有模型简单、状态数较少、识别速度刽、内存占用少且与识别词汇量无关等优点,但其对发音的相关性描述不够精确,一选识别率不搞。Triphone和Syllable模型对发音相关性能准确建模,但模型数量巨大..
说到语音识别,一般都从以下公式开始介绍(转自:https://blog.csdn.net/yutianzuijin/article/details/77621511)为什么声学模型是这种形式我一直有困惑,因为在实际使用中,现在的声学模型一般都是神经网络,神经网络的输入是声学特征,输出直接就是某个音素或者音节的概率了,和上述对声学模型的描述并不相符。向同事请教后,原来是因为我不明白似然概率和后验概率







