智能(语音)对话系统架构研究
本文所谈及的架构主要指使用已有的智能对话服务来搭建一个应用系统,而不会深入的探讨智能对话服务内部的架构。智能对话系统的需求目标 智能对话系统可以提供回答问题的能力,即在理解自然语言的基础上,解答用户提出的问题。进一步的,可以提供基于任务的对话能力,及判断用户的意图,通过多轮对话收集必要的信息,完成订票,查找音乐等服务。智能对话系统的架构概览 上图是阿里云智能对话平台文档中的智能
·
本文所谈及的架构主要指使用已有的智能对话服务来搭建一个应用系统,而不会深入的探讨智能对话服务内部的架构。
智能对话系统的需求目标
智能对话系统可以提供回答问题的能力,即在理解自然语言的基础上,解答用户提出的问题。进一步的,可以提供基于任务的对话能力,及判断用户的意图,通过多轮对话收集必要的信息,完成订票,查找音乐等服务。
智能对话系统的架构概览
上图是阿里云智能对话平台文档中的智能语音交互系统架构图,从架构图中可以看到有以下重要的组件:
- 用户端应用。用户直接使用的设备上的应用,如运行于浏览器的H5聊天应用,或者独立的APP。
- 路由服务。
- 智能对话。提供问答和对话服务的应用或SAAS平台。可以使用百度UNIT,或阿里云的智能对话服务。(2018/5/30 阿里云的智能对话服务最近在升级,新用户暂时无法使用)
- 第三方内容服务。
- 客户应用内容服务。
- 客户管控台。客户管理控制智能对话服务的界面。企业客户可以在控制台中设置意图,训练、测试和发布自己的对话服务。
以上的组件可以支撑和用户的文本对话能力,如果要和用户进行语音对话,还需要ASR和TTS组件。
- ASR,Automatic Speech Recognition的简写,将人的语音转换为文本的技术。
- TTS,Text To Speech的缩写,将文本转换为人的语音。先进的TTS技术输出的语音音律流畅,使得听者感觉自然。
参考资料
1. https://help.aliyun.com/document_detail/64541.html
更多推荐
已为社区贡献1条内容
所有评论(0)