logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

深度学习(四十一)——深度强化学习(4)A2C & A3C, DDPG

A2C & A3CActor-Critic一般简称AC算法。针对它的一般用法参见《机器学习(三十五)》。AC算法也可用于DRL领域,具体的做法和DQN类似:一个Actor网络,用来近似V值。一个Critic网络,用来近似Q值。这里有个小技巧:Actor网络和Critic网络可以共享网络参数,两者仅最后几层使用不同结构和参数。(参见下图A3C的图)针对AC的改进,衍...

语音识别(三)——声学模型, 解码器技术

声源定位(续)波束形成声源定位的方法包括波束形成,超分辨谱估计和TDOA,分别将声源和阵列之间的关系转变为空间波束,空间谱和到达时间差,并通过相应的信息进行定位。波束形成是通用的信号处理方法,这里是指将一定几何结构排列的麦克风阵列的各麦克风输出信号经过处理(例如加权、时延、求和等)形成空间指向性的方法。波束形成主要是抑制主瓣以外的声音干扰,这里也包括人声,比如几个人围绕Echo谈话...

深度学习(十九)——FCN, SegNet, DeconvNet, DeepLab, ENet, GCN

前DL时代的语义分割(续)Grab cutGrab cut是微软剑桥研究院于2004年提出的著名交互式图像语义分割方法。与N-cut一样,grab cut同样也是基于图划分,不过grab cut是其改进版本,可以看作迭代式的语义分割算法。Grab cut利用了图像中的纹理(颜色)信息和边界(反差)信息,只要少量的用户交互操作即可得到比较好的前后背景分割结果。在Grab cut中,R...

深度学习(二十二)——ESPCN, FSRCNN, VESPCN, SRGAN, DemosaicNet, MemNet, RDN, ShuffleSeg

https://antkillerfarm.github.io/ESPCNESPCN(efficient sub-pixel convolutional neural network)是创业公司Magic Pony Technology的Wenzhe Shi和Jose Caballero作品。该创业团队主要来自Imperial College London,目前已被Twitter收购。...

语音识别(四)——DTW, Spectrogram, Cepstrum Analysis

DTWDynamic Time Warping是Vintsiuk于1968年提出的算法。Taras Klymovych Vintsiuk,1939~2012,乌克兰科学家,毕业于Kyiv Polytechnic Institute。模式识别专家,语音识别领域的奠基人之一。图1如上图所示,因为语音信号具有相当大的随机性,即使同一个人在不同时刻发同一个音,也不可能具有完全的...

深度学习(二十九)——Normalization进阶, CTC

Normalization进阶和Batch Normalization类似的概念还有Weight Normalization和Layer Normalization。Batch Normalization从上图可以看出,BN是对input tensor的每个通道进行mini-batch级别的Normalization。而LN则是对所有通道的input tensor进行Normalizati...

深度学习(二十五)——Attention(2)

Attention(续)Multi-Head Attention这个是Google提出的新概念,是Attention机制的完善。不过从形式上看,它其实就再简单不过了,就是把Q,K,V通过参数矩阵映射一下,然后再做Attention,把这个过程重复做h次,结果拼接起来就行了,可谓“大道至简”了。具体来说:headi=Attention(QWQi,KWKi,VWVi)headi=A...

深度学习(三十七)——CenterNet, Anchor-Free, NN Quantization

CenterNetCenterNet是中科院、牛津、Huawei Noah’s Ark Lab的一个联合团队的作品。(2019.4)论文:《CenterNet: Keypoint Triplets for Object Detection》上图是CenterNet的网络结构图。正如之前提到的,框对于物体来说不是一个最好的表示。同理,Corner也不是什么特别好的表示:绝大多数情况下,C...

机器学习(七)——规则化和模型选择

机器学习(七)——规则化和模型选择

#机器学习
机器学习(二十)——EMD, LSA, HMM

机器学习(二十)——EMD, LSA, HMM

#机器学习
    共 54 条
  • 1
  • 2
  • 3
  • 6
  • 请选择