logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

语音识别——解码器(WFST、Lattice)

基于Viterbi的原始动态解码器使用广度优先搜索在原始的搜索网络中同时生成多条假设,并且依靠剪枝算法不会使网络变得太大。

文章图片
#开发语言#语音识别
MFCC特征提取

在语音识别方面,最常用到的语音特征就是梅尔倒谱系数(Mel-scaleFrequency Cepstral Coefficients,简称MFCC)。MFCC的提取过程包括预处理、快速傅里叶变换、Mei滤波器组、对数运算、离散余弦变换、动态特征提取等步骤。

文章图片
#语音识别#人工智能
N-gram语言模型

N-Gram是大词汇连续语音识别中常用的一种语言模型。该模型基于这样一种假设,第N个词的出现只与前面N-1个词相关,而与其它任何词都不相关,整句的概率就是各个词出现概率的乘积。

文章图片
#语言模型#语音识别#人工智能
目标检测前言——YOLO

目标检测,也叫目标提取,是一种基于目标几何和统计特征的图像分割。它将目标的分割和识别合二为一,其准确性和实时性是整个系统的一项重要能力。

文章图片
#目标检测
目标检测前言——YOLO

目标检测,也叫目标提取,是一种基于目标几何和统计特征的图像分割。它将目标的分割和识别合二为一,其准确性和实时性是整个系统的一项重要能力。

文章图片
#目标检测
傅里叶变换概述

离散傅立叶变换在数字信号处理中几乎可以说是一个的必学的钦定函数,多年来在图像,音频,噪声处理,信号调制解调中发挥着巨大的作用。

文章图片
#语音识别#人工智能
N-gram语言模型

N-Gram是大词汇连续语音识别中常用的一种语言模型。该模型基于这样一种假设,第N个词的出现只与前面N-1个词相关,而与其它任何词都不相关,整句的概率就是各个词出现概率的乘积。

文章图片
#语言模型#语音识别#人工智能
基于GMM—HMM的语音识别全过程

语音识别技术就是让机器通过识别与理解把语音信号转换为相应的文本或命令的技术。

文章图片
#语音识别#人工智能
语音识别——解码器(WFST、Lattice)

基于Viterbi的原始动态解码器使用广度优先搜索在原始的搜索网络中同时生成多条假设,并且依靠剪枝算法不会使网络变得太大。

文章图片
#开发语言#语音识别
MFCC特征提取

在语音识别方面,最常用到的语音特征就是梅尔倒谱系数(Mel-scaleFrequency Cepstral Coefficients,简称MFCC)。MFCC的提取过程包括预处理、快速傅里叶变换、Mei滤波器组、对数运算、离散余弦变换、动态特征提取等步骤。

文章图片
#语音识别#人工智能
到底了