
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
windows下安装tensorflow-gpu:首先查看我们自己的电脑是否携带gpu,以及计算力是否达到3以上。。。目前我们的电脑基本上都是可以达到这个标准的。。。。可以放心安装。。。。。python环境推荐安装anaconda。。。。。1.准备.condarc文件的配置:目的就是为了下载快。channels:- defaultsshow_channel_urls: truedefault_ch
(1)——从arpa格式的ngram到G.fst:https://zhuanlan.zhihu.com/p/572143181。

关于DL里面各种classifier线性层的称谓Linear,Dense,MLP,FC之间的区别。Linear:线性层,最原始的称谓,单层即无隐层。熟悉torch的同学都清楚torch.nn.Linear就是提供了一个in_dim * out_dim的tensor layer而已。Dense:密集层,可以指单层linear也可以指多层堆叠,可无隐层也可有但一般多指后者。熟悉keras的同学也知道d
1、其实transformer最重要的就是,输入的是什莫,输出是什么,主要的组成部分是什么?现在明白一点输入和另外一个的输入其实相差一位,output主要是为了训练的时候,让下一个知道之前都发生了什么,让下一个输出在知道上一输出的内容,为了充分学习这一句话。output是最主要的就是它具有掩蔽...
解决报错/usr/bin/env: ‘python’: No such file or directory一.启动某个程序报错/usr/bin/env: ‘python’: No such file or directory二.解决方法1.查看python3的版本python3 --version2.查找python3的安装位置:whereis python33.为其创建符号连接:sudo ln
with open(’./aishell_transcript_v0.8.txt’,‘r’,encoding=‘utf-8’) as f:lines = f.readlines()vocab = []for line in lines:line = line.split()liness = line[1:]l = ‘’.join(liness)l = ’ ‘.join(l)l = l.split(
Speech Recognition PapersStreaming ASRRNA basedRNN-T basedAttention basedUnified Streaming/Non-streaming modelsNon-autoregressive (NAR)ASRASR Rescoring / Spelling Correction (2-pass decoding)On-device
语音识别技术随着神经网络的兴起和发展,准确率得到了很大的改善,在很多场景下都可以逐步商用落地了,很多公司也组建了语音团队。其实在github上,语音识别相关的项目也是层出不穷,其中的一些项目的质量很高,如果好好借鉴学习的话可以避免从头造轮子,毕竟造轮子也不是那么容易的 = =!。在这里,对一些比较流行的项目做一些汇总和简单介绍。ASR1.1 kaldihttps://github.com/kald
语谱图一般口语上说的是语音的log谱特征,就是你用audition或者Audacity看到的横轴是时间,纵轴是频域的图像。简单看一下语音特征的提取过程就可以知道这两者之间的关系了:对语音序列做STFT,其中包括分帧,加窗和对每一帧的DFT变换,一般在语音识别里面会在加窗之后加一步预加重,输出的结果是复数(DFT的原因)。STFT的结果取模称为线性谱,再加log称为log谱,此处对应语谱图的概念。对







