zx超个人主页

@weixin_44885180

zx超

2022-06-24 21:20:13 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

c++: string中 find, rfind, find_frist_of, find_laste_of 与 substr之间的操作

类中，有几个成员函数可以用于在字符串中执行搜索和子字符串提取操作。中任意字符的最后一次出现的位置（索引）。中任意字符的第一次出现的位置（索引）。，默认情况下从字符串的末尾开始搜索。如果找不到子字符串，返回。，默认情况下从字符串的末尾开始搜索。最后一次出现的位置（索引）。: 反向查找给定字符集合中任意字符最后一次出现的位置。第一次出现的位置（索引）。: 查找给定字符集合中任意字符第一次出现的位置。:

#c++

语音识别之WFST解码器

（1）——从arpa格式的ngram到G.fst:https://zhuanlan.zhihu.com/p/572143181。

#语音识别

语音识别降噪思路和总结

噪声问题一直是语音识别的一个老大难的问题，在理想的实验室的环境下，识别效果已经非常好了，之前听很多音频算法工程师抱怨，在给识别做降噪时，经常发现WER不降反升，降低了识别率，有点莫名其妙，又无处下手。刚好，前段时间调到了AIlab部门，有机会接触这块，改善语音识别的噪声问题，虽然在此之前，询问过同行业的朋友，单通道近场下，基本没有太大作用，有时反而起到反作用，但是自己还是想亲身实践一下，至少找到这

#人工智能

安装gpu版本的tensorflow2.**

windows下安装tensorflow-gpu：首先查看我们自己的电脑是否携带gpu，以及计算力是否达到3以上。。。目前我们的电脑基本上都是可以达到这个标准的。。。。可以放心安装。。。。。python环境推荐安装anaconda。。。。。1.准备.condarc文件的配置：目的就是为了下载快。channels:- defaultsshow_channel_urls: truedefault_ch

#tensorflow

liner、dense、mlp、fc区别

关于DL里面各种classifier线性层的称谓Linear,Dense,MLP,FC之间的区别。Linear:线性层，最原始的称谓，单层即无隐层。熟悉torch的同学都清楚torch.nn.Linear就是提供了一个in_dim * out_dim的tensor layer而已。Dense：密集层，可以指单层linear也可以指多层堆叠，可无隐层也可有但一般多指后者。熟悉keras的同学也知道d

#神经网络

语音识别数据列表和字典处理脚本

with open(’./aishell_transcript_v0.8.txt’,‘r’,encoding=‘utf-8’) as f:lines = f.readlines()vocab = []for line in lines:line = line.split()liness = line[1:]l = ‘’.join(liness)l = ’ ‘.join(l)l = l.split(

语音识别相关期刊

Speech Recognition PapersStreaming ASRRNA basedRNN-T basedAttention basedUnified Streaming/Non-streaming modelsNon-autoregressive (NAR)ASRASR Rescoring / Spelling Correction (2-pass decoding)On-device

#语音识别 #深度学习 #人工智能

语音识别开源项目汇总

语音识别技术随着神经网络的兴起和发展，准确率得到了很大的改善，在很多场景下都可以逐步商用落地了，很多公司也组建了语音团队。其实在github上，语音识别相关的项目也是层出不穷，其中的一些项目的质量很高，如果好好借鉴学习的话可以避免从头造轮子，毕竟造轮子也不是那么容易的 = =！。在这里，对一些比较流行的项目做一些汇总和简单介绍。ASR1.1 kaldihttps://github.com/kald

#语音识别

语音特征：mfcc、fbank和语谱图概述

语谱图一般口语上说的是语音的log谱特征，就是你用audition或者Audacity看到的横轴是时间，纵轴是频域的图像。简单看一下语音特征的提取过程就可以知道这两者之间的关系了：对语音序列做STFT，其中包括分帧，加窗和对每一帧的DFT变换，一般在语音识别里面会在加窗之后加一步预加重，输出的结果是复数（DFT的原因）。STFT的结果取模称为线性谱，再加log称为log谱，此处对应语谱图的概念。对

#语音识别

共 14 条

请选择