logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

语音识别-语言模型

发布于2017-04-27 由AILEMON统计语言模型:从中文拼音到文本前言:自然语言是信息的载体,记录和传播着信息,信息论之父香农对信息的定义是“信息是用于消除随机不确定性的东西”。信息通过编码,经过一定的信道传输,然后传递到接收者,再解码成对应的可被人理解感知的东西,就完成了一次信息的传递。原始人的通信方式就是说话,而说话是先将信息编码为对应的语言信号,可以是文本,可以是声音...

#语音识别
深度学习调参经验

做dl也有一段时间了,积累了一些经验,也在网上看到一些别人的经验。 为了面试,结合知乎上面的问答,我也总结了一下,欢迎大家补充。知乎 深度学习调参有哪些技巧?一. 初始化 有人用normal初始化cnn的参数,最后acc只能到70%多,仅仅改成xavier,acc可以到98%。二.从理解CNN网络以产生直觉去调参数的角度考虑,应该使用可视化 可视化(知乎用户 杨军)1.Visualize Laye

Kaldi中激活cuda

运行DNN需要激活cuda,下面讲解一下如何在kaldi中使用cuda:   1.在kaldi的src目录下./configure ,会显示cuda是不是安装好了。  2.然后make all;  3.最后到src的cudamatrix目录下运行:./cu-vector-test,就会显示gpu什么的啊。  至此,你就大功告成了啊。你可以运行kaldi里的dnn模块啊。enjo...

keras 高级激活函数

高级激活层Advanced ActivationLeakyReLU层keras.layers.advanced_activations.LeakyReLU(alpha=0.3)LeakyRelU是修正线性单元(Rectified Linear Unit,ReLU)的特殊版本,当不激活时,LeakyReLU仍然会有非零输出值,从而获得一个小梯度,避免ReLU可能出现的神经元“死亡”现...

深度学习调参经验

做dl也有一段时间了,积累了一些经验,也在网上看到一些别人的经验。 为了面试,结合知乎上面的问答,我也总结了一下,欢迎大家补充。知乎 深度学习调参有哪些技巧?一. 初始化 有人用normal初始化cnn的参数,最后acc只能到70%多,仅仅改成xavier,acc可以到98%。二.从理解CNN网络以产生直觉去调参数的角度考虑,应该使用可视化 可视化(知乎用户 杨军)1.Visualize Laye

python中计算BLEU分数

BLEU,全称为Bilingual Evaluation Understudy(双语评估替换),是一个比较候选文本翻译与其他一个或多个参考翻译的评价分数。尽管BLEU一开始是为翻译工作而开发,但它也可以被用于评估文本的质量,这种文本是为一套自然语言处理任务而生成的。通过本教程,你将探索BLEU评分,并使用Python中的NLTK库对候选文本进行评估和评分。完成本教程后,你将收获:B...

CNN-Attention

Attention Mechanism可以帮助模型对输入的X每个部分赋予不同的权重,抽取出更加关键及重要的信息,使模型做出更加准确的判断,同时不会对模型的计算和存储带来更大的开销,这也是Attention Mechanism应用如此广泛的原因。 之前在做知识库问答和阅读理解问答的研究中都用到了attention机制,效果确实比较显著(虽然减慢训练速度的效果也比较显著…)。在是谷歌发布论文Atte.

Ubuntu16.04下修改python默认版本

1.cd /usr/bin2.sudo rm -rf python3.sudo ln -s /usr/bin/python3  /usr/bin/python

Attention

最近两年,注意力模型(Attention Model)被广泛使用在自然语言处理、图像识别及语音识别等各种不同类型的深度学习任务中,是深度学习技术中最值得关注与深入了解的核心技术之一。本文以机器翻译为例,深入浅出地介绍了深度学习中注意力机制的原理及关键计算机制,同时也抽象出其本质思想,并介绍了注意力模型在图像及语音等领域的典型应用场景。注意力模型最近几年在深度学习各个领域被广泛使用,无论是图...

CTC学习

背景Connectionist temporal classification简称CTC,翻译不太清楚,可以理解为基于神经网络的时序类分类。其中classification比较好理解,表示分类问题;temporal可以理解为时序类问题,比如语音识别的一帧数据,很难给出一个label,但是几十帧数据就容易判断出对应的发音label,这个词也给出CTC最核心的意义;connectionist可以理解为

#语音识别
    共 35 条
  • 1
  • 2
  • 3
  • 4
  • 请选择