logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

linux如何把菜单栏移动到底部和左侧

gsettings set com.canonical.Unity.Launcher launcher-position Bottomgsettings set com.canonical.Unity.Launcher launcher-position Left命令是调整到左边的参考文献:https://blog.csdn.net/deus_ex_machina/article/details/

关于kaldi中yesno脚本的详细分析,以及脚本的理解

  本人经过一番寒彻骨,学习shell、linux、kaldi,终于将kaldi中最简单的样例理解,由于过于口语话,文中可能出现措辞不当,忘谅解。  首先我们打开kaldi中yesno例子,打开脚本run.sh,第一行是脚本解释器,,我们采用bash这个脚本解释器;  然后是train_cmd,decode_cmd两个变量,进行本地运行。对于接下来的if条件语句,如果你已经下载了yesno的语料,

Ubuntu16.04下修改python默认版本

1.cd /usr/bin2.sudo rm -rf python3.sudo ln -s /usr/bin/python3  /usr/bin/python

Attention

最近两年,注意力模型(Attention Model)被广泛使用在自然语言处理、图像识别及语音识别等各种不同类型的深度学习任务中,是深度学习技术中最值得关注与深入了解的核心技术之一。本文以机器翻译为例,深入浅出地介绍了深度学习中注意力机制的原理及关键计算机制,同时也抽象出其本质思想,并介绍了注意力模型在图像及语音等领域的典型应用场景。注意力模型最近几年在深度学习各个领域被广泛使用,无论是图...

CTC学习

背景Connectionist temporal classification简称CTC,翻译不太清楚,可以理解为基于神经网络的时序类分类。其中classification比较好理解,表示分类问题;temporal可以理解为时序类问题,比如语音识别的一帧数据,很难给出一个label,但是几十帧数据就容易判断出对应的发音label,这个词也给出CTC最核心的意义;connectionist可以理解为

#语音识别
隐马尔可夫模型基本概念(1)

最近抽空学习下Kaldi下语音识别系统,参考西工大谢磊老师硕士论文与其他博客对Kaldi下语音识别算法进行学习研究。隐马尔科夫模型(Hidden Markov Model,HMM)本质上是一种统计模型,将HMM应用与语音识别解决三大问题,后续奉上理论推导(本人前期博客手推过一个版本)。一、HMM定义1.1 状态定义研究HMM首先得知道其定义并能对其定义进行准确的描述,...

#语音识别
ubuntu16.04下opencv安装

1.OpenCV下载 首先创建一个空的文件夹,进入文件夹执行如下命令,如我创建的文件夹是opencv-pythoncd opencv-pythongit clone https://github.com/opencv/opencv.git12也可以直接进入网址OpenCV_Download下载 使用git下载后应有一个名字为opencv的文件夹,进入文件夹执行如下命令:...

#opencv
语音识别

tensorflow 语音识别最近在做语音识别的项目,现在项目告一段落,就把最近碰到的东西做一个总结。一些资料 https://medium.com/@ageitgey/machine-learning-is-fun-part-6-how-to-do-speech-recognition-with-deep-learning-28293c162f7a https://distill.pub/201

kaldi 在线识别中bug修复

【问题描述】使用kaldi工具包进行在线语音识别,识别麦克风输入,输出识别结果。使用egs/voxforge/online_demo文件夹时,./run.sh --test-mode live输出portaudio failed to open the defalut stream【解决办法】分三步进行解决。1.首先检查linux系统录音功能是否可用:arecord命令,如arecord -d 1

语音识别的前世今生

这是我4月份在BitTiger公开课听的王赟大牛《语音识别的前世今生》整理的笔记,本来打算整理通畅再发的,结果实在没时间就一拖再拖。笔记有些草率,不过应该可以看明白,希望可以对大家有用,也祝王赟大神好。Q&A1. 历史上非特定人和特定人的语音识别是不是有很大的不同?这个就是前面讲过的打补丁,各种说话人适应的那一页(如下图)这一页上的这三种方法就是历史上,其实也包...

#语音识别
    共 36 条
  • 1
  • 2
  • 3
  • 4
  • 请选择