
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
错误接受率 (FAR), 错误拒绝率(FRR), 等错误率(EER)
不管是声纹识别和图像识别,以及指纹识别,在评价模型时总要用到这三个指标。下边说下这三个指标的含义。1、错误接受率 (FAR-False Acceptance Rate)FAR = nontarget_is_target / ( target_is_target + nontarget_is_target )另一种比较容易理解的表示方式:
声学模型GMM-HMM训练
语音识别中声学模型是重中之重,常用到的声学模型是GMM-HMM,本文记录下声学模型训练的细节。下图是识别某个孤立字的GMM-HMM示意图。HMM部分是文字所占的音素以及其转移概率。语音帧通过已经训练好的GMM得属于某个音素的概率,如0.016。问题是这样的一个模型怎么训练呢?问题一、一段语音是怎么切割音素的,如’我‘的拼音是wo,我们按声韵母分开是:w o? 如果要训练w和o的分界
语音特征MFCC和PLP
【传送门】【自动语音识别课程】第一课 统计语音识别介绍原文地址:http://blog.csdn.net/joey_su/article/details/36414877概述针对ASR的语音信号分析特征频谱分析倒谱分析标准特征:MFCC和PLP分析动态特征第一课的结尾提到了语音识别的框图,下图展示了信号分析技术在语音识别系统中的位置:我们先来认识下语音的产生过程:语音是在发音器官和声道共同作用下产
到底了







