第1章第3节 AI语音简介

        本章首先介绍语音的基本概念及语音的产生原理,然后介绍什么是人工智能语音、人工智能语音交互和人工智能语音测试,最后阐述人工智能语音测试的目的和意义,引领大家走入人工智能语音测试的世界。

目录

第1章第3节 人工智能简介

1.3  AI语音简介

1.3.1  AI语音技术简介

1.3.2  AI语音交互简介


1.3  AI语音简介

AI语音既人工智能语音技术,以语音识别技术为开端,实现人机语言的通信,包括语音识别技术(ASR)、自然语言处理技术(NLP)和语音合成技术(TTS)。通俗点说就是通过语音这个媒介进行人与机器交互的技术就是人工智能语音技术。

从上文不难看出,AI语音其实就是将人与人之间的语音交互,切换到人与机器的交互,发送人仍然是人,但接受人转换为机器了。

1.3.1  AI语音技术简介

AI语音技术主要包含语音识别技术(ASR)、自然语言处理技术(NLP)和语音合成技术(TTS)等3大技术。

(1)语音识别技术(Automatic Speech Recognition,ASR),自动将语音转化成文字的技术。

(2)自然语言处理技术(Natural Language Processing,NLP),理解语音识别的文字并给出理解反馈的技术。

(3)语音合成技术(Text to Speech,TTS),针对自然语言处理后的需要机器语音反馈内容,进行文本转化成语音的技术(语音合成技术其实就是语音识别技术的逆过程)。

对标人与人之间的语音交互,我们把发送人想成发送语音命令的用户,接收人想成智能机器。这样语音识别技术(ASR)就相当于语音交互的“接收”阶段,感知对方说话内容。自然语言处理技术(NLP)就相当于语音交互的“解码”阶段,理解对方话语的含义。语音合成技术(TTS)则相当于“发送”阶段,把智能机器想说的话通过扬声器播放出来,反馈给用户。

1.3.2  AI语音交互简介

当前AI语音技术的应用落地都采用人工智能语音交互方式,AI语音交互是基于语音识别(Automatic Speech Recognition,ASR)、自然语言处理(Natural Language Processing,NLP)和语音合成(Text-To-Speech,TTS)等技术,为企业在多种实际应用场景下,赋予产品“能听、会说、懂你”式的智能人机交互体验。适用于多个应用场景中,包括智能问答、智能质检、法庭庭审实时记录、实时演讲字幕、访谈录音转写等场景,在金融、保险、司法、电商等多个领域均有实际应用案例。不仅仅是电脑、手机,人们的衣食住行的方方面面都开始应用出现不久的智能技术,智能电视、智能导航,智能家居等,智能技术将在人们生活的各个方面提供更加方便快捷的服务。

如图1-4所示的siri(苹果智能语音助手)、天猫精灵、百度地图智能助手都是目前成熟的AI语音产品,大家可能在生活中也早就有接触。

  

图1-4  AI语音产品:siri(苹果智能语音助手)、天猫精灵、百度地图智能助手

更多推荐