
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
语音识别技术随着神经网络的兴起和发展,准确率得到了很大的改善,在很多场景下都可以逐步商用落地了,很多公司也组建了语音团队。其实在github上,语音识别相关的项目也是层出不穷,其中的一些项目的质量很高,如果好好借鉴学习的话可以避免从头造轮子,毕竟造轮子也不是那么容易的 = =!。在这里,对一些比较流行的项目做一些汇总和简单介绍。1. ASR1.1 kaldihttps://github.com/k
在传统语音识别中,声学模型部分目前已经是神经网络的天下了,变的越来越傻瓜,解码部分还是保留,特别是在孤立词识别(唤醒)中,解码方案和参数对于识别的效果(准确率和唤醒率)的影响也不能忽略。在解码中,token passing算法是一种既使用又易于理解的算法。这里转载一篇文章,对token passing有比较全面的解释。转载自:https://blog.csdn.net/JosephPai/arti
1.摄像机成像原理成像的过程实质上是4个坐标系的转换。首先空间中的一点由 世界坐标系 转换到 摄像机坐标系 ,然后再将其投影到成像平面 (图像物理坐标系 ) ,最后再将成像平面上的数据转换到图像平面 (图像像素坐标系 ) 。 下文对4个坐标系的 变换做了详细的解释:http://blog.csdn.net/humanking7/article/details
现在大部分的深度学习教程中都把卷积定义为图像矩阵和卷积核的按位点乘。实际上,这种操作亦应该是互相关(cross-correlation),而卷积需要把卷积核顺时针旋转180度然后再做点乘。数学定义:卷积:互相关:在卷积层的反向传播中,其实是需要对前一层的误差(也叫敏感度sensitivity)做padding(补零)然后再和卷积核做真正的卷积操作,也就是需要把卷积核顺时针翻转180度。...
二次型多元函数极值Hessian矩阵正定矩阵如何判断一个矩阵是否是正定的,负定的,还是不定的呢?一个最常用的方法就是顺序主子式。实对称矩阵为正定矩阵的充要条件是的各顺序主子式都大于零。当然这个判定方法的计算量比较大。对于实二次型矩阵还有一个判定方法:实二次型矩阵为正定二次型的充要条件是的矩阵的特征值全大于零。为负定二次型的充要条件是的矩阵的特征值全小于零,否则是不定的。多元函数极值的判定泰勒展开式
神经网络模型的效果及优化的目标是通过损失函数来定义的。1.平方差损失函数平方差函数是最常用的损失函数,也就是L2 loss再除以2。E=12(a−y)2E=12(a−y)2 E=\frac{1}{2}(a-y)^2其中y是我们期望的输出,a为神经元的实际输出 (a=σ(Wx+b)a=σ(Wx+b)a=\sigma(Wx+b), σσ\sigma 是激活函数) 。也就...
转自我的知乎专栏:https://zhuanlan.zhihu.com/p/34378516/edit神经网络模型是人工智能最基础的模型,它的诞生也是受益于神经科学家对猫的大脑的研究。神经网络通过自学习的方式可以获得高度抽象的,手工特征无法达到的特征,在计算机视觉领域取得了革命性的突破。而神经网络之所以最近几年取得了这么大的成功,反向传播算法是一个很重要的原因。可以说,只有深入了解了反向传播算..
docker是个类似虚拟机的东西,但是比虚拟机好用,更轻量级。而且可以直接使用系统硬件,比如gpu。在很多时候,如果有一个docker image,可以省去很多配置环境,安装依赖包等的繁琐工作。docker的简单教程:http://www.runoob.com/docker/ubuntu-docker-install.html本文介绍一下在ubuntu 14.04下docker的安装和使用1.
1.后台运行Linux下一般想让某个程序在后台运行,很多都是使用& 在程序结尾来让程序自动运行。比如我们要运行tesh.sh在后台:./tesh.sh &一般这种程序使用& 结尾,如果终端关闭,那么程序也会被关闭2.关闭终端之后继续运行需要使用nohup这个命令,比如我们有个test.sh需要在后台运行,并且希望在后台能够一直运行,那么就使用nohup
下载putty(需要包含pscp.exe):https://www.chiark.greenend.org.uk/~sgtatham/putty/latest.html在pscp,exe目录下打开命令窗口从linux下载文件到windows:pscp.exe i-turing@114.80.0.201:/home/i-turing/carpn.zip d:\carp







