摘  要:语音识别的目的主要是是让各种各样的机器能听懂人的语言,换句话说就是在任何情况下,都能准确地识别出人类说话的内容。语音识别技术既是国际竞争的一项重要技术,也是每一个国家经济发展不可缺少的重要技术支撑。本设计从时间和频率两个角度对语音信号产生的数学模型进行分析,系统地阐述了语音识别的基本概念。借助Matlab软件中图形编写界面GUI,实现了一个可以实时录音并进行语音识别的系统。所选择的模型是隐马尔科夫模型(HMM) ,语音特征参数主要选择MEL频率倒谱系数,设计了从数字0到数字9的语音识别系统。该系统可靠性高,实时性好,正确率高。

关键词:语音识别,Matlab,隐马尔科夫模型,GUI

目录

摘要

Abstract

1  前言-4

1.2  语音识别系统的基本构成-4

2  语音信号分析-4

2.1  语音学基本知识-4

2.1.1  音素和音节-4

2.1.2  语音信号产生模型-5

2.2  声音信号的数字化和预处理-5

2.2.1  数字化-5

2.2.2  信号的预加重处理-6

2.3  语音信号的时域分析-6

2.3.1  短时能量分析-6

2.3.2  短时平均过零率-8

2.4  语音信号的频域分析-8

3  基于Matlab环境下的语音识别算法分析-10

3.1  语音端点检测-11

3.2  特征参数提取-12

3.2.1  LPCC倒谱系数-12

3.2.2  MFCC倒谱系数-12

3.3  训练和识别-13

4  基于Matlab环境下图形编写界面GUI的实现-13

4.1  函数关系-13

4.2  操作步骤及设计思路-14

5  语音识别实现过程-16

结论-20

参考文献-21

附录A:主要程序程序代码-23

附录B:GUI程序代码-26

Logo

CSDN联合极客时间,共同打造面向开发者的精品内容学习社区,助力成长!

更多推荐