工业应用|AI语音技术应用场景及模型库概览

近年来AI技术发展速度迅猛，深入到生活中的方方面面，从手机APP到车载语音系统。今天小PP和大家一起仔细了解，AI技术中的语音技术在各场景的应用，并奉上对应模型~语音识别...

飞桨PaddlePaddle

951人浏览 · 2018-07-26 23:45:49

飞桨PaddlePaddle · 2018-07-26 23:45:49 发布

近年来AI技术发展速度迅猛，深入到生活中的方方面面，从手机APP到车载语音系统。今天小PP和大家一起仔细了解，AI技术中的语音技术在各场景的应用，并奉上对应模型~

语音识别技术

语音识别其实是一种感知智能，核心功能是将物理世界的信息转化成可供计算机处理的信息，为后续的认知智能提供基础。

实际上，语音识别早已经应用于我们日常生活中的方方面面。现在非常多的手机APP支持语音识别，解放双手提升效率。像社交类APP微信的语音转文字、翻译APP有道词典即可通过识别语音进行外语翻译、记录类APP以及可以语音输入的输入法APP等等。

除了APP中应用，目前车载也是语音技术落地的重要场景。通过语音识别，驾驶者可直接与车辆进行互动，比如要求车辆打开窗户、关闭天窗、开灯等等。智能控制车辆等技术已经开始批量进入生产，百度、科大讯飞等公司都有对应的合作车型，进行智能车机落地。

undefined

■ ■■■■

除上述应用方向，语音识别技术落地场景多种多样。语音技术也是深度学习算法工程师从业的重要方向之一，那么哪些框架里能找到语音识别模型呢？

目前主流深度学习框架都有各自的语音识别模型。比如Tensorflow有TF Speech， Pytorch通过ASR实现语音到文本端的模型，PaddlePaddle有DeepASR模型。小伙伴们可以按自己的需求选择模型并尝试。目前PaddlePaddle的语音识别模型使用的是汉语数据集，配合中文教材，小伙伴们可以快速上手训练语音识别模型~

详细链接：

https://github.com/PaddlePaddle/models/tree/develop/fluid/DeepASR

语音合成技术