Alexa于2014年推出,在过去的六年多时间里,我们一直在兑现让Alexa变得更智能的承诺。除了在语音识别和自然语言理解系统等Alexa核心AI技术方面的基础改进外,Alexa科学家还开发了持续为客户带来惊喜的技术,比如耳语语音和Alexa的新实时翻译服务。

但我们已开始引入的一些技术,加上我们正在研究的其他技术,都预示着Alexa发展将迎来阶段性变革——以及AI领域本身的变革。总的来说,这些技术将为Alexa语音服务和Alexa开发者可用工具带来新的通用性和自主性水平,开启人工智能的新"自主时代",在这个时代,像Alexa这样的AI系统将变得更加自我感知和自主学习,并且能够通过经验丰富的开发者甚至最终用户实现自助服务。

自我感知指的是保持对环境状态(例如时间、温控器读数和最近操作)的感知能力,并运用常识推理进行反映该感知和先验/世界知识的推断。Alexa直觉功能已经能够识别客户日常例程中的异常并提出修正建议——例如注意到夜间灯还亮着并主动提供关闭建议。在常识推理的支持下,自我感知更进一步:例如,如果客户在孩子足球训练结束前五分钟打开电视,未来的AI可能会推断客户需要接送提醒。

自主学习是Alexa在没有人为干预的情况下改进和扩展其能力的能力。与自我感知一样,自主学习也运用推理:例如,客户对某个操作的回应是否表明对该操作不满意?同样,当客户发出不熟悉的指令时,真正自主学习的Alexa将能够推断其可能含义——也许通过搜索网络或探索知识库——并提出可能性。

自助服务本质上意味着AI的民主化。没有编程经验的Alexa客户应该能够自定义Alexa服务,甚至创建新的Alexa功能,而没有机器学习经验的技能开发者应该能够构建复杂而稳健的对话技能。通俗地说,这些就是对话AI领域的无代码和低代码开发环境等价物。

需要明确的是,自主时代尚未完全到来,它的曙光需要仍在开发中的技术走向成熟,无论是在该中心还是其他地方。但Alexa最近推出的一些功能预示着东方天空的曙光。

自我感知
2018年,我们为智能家居推出了Alexa直觉功能,Alexa会根据异常传感器数据建议采取行动。到2021年初,科学已经进步到足以让我们推出一项选择加入服务,Alexa可以立即自动采取行动。同时,我们一直在努力将直觉功能扩展到智能家居以外的Alexa服务。

但常识推理需要更多能力——从可观察的时间模式推断客户隐含意图的能力。例如,如果客户调低温控器、关灯、锁前门并打开车库,这意味着什么?如果客户以"Alexa,Rolling Hills Cine Plaza在演什么?"这样的查询开始互动呢?

2020年,我们通过新的Alexa功能向常识推理迈出了步伐,该功能可以推断客户的潜在目标——一系列请求背后的最终目的。例如,当客户询问海滩天气时,Alexa可能会使用该查询,结合其他上下文信息,推断客户可能对去海滩旅行感兴趣。Alexa然后可以提供当前到海滩的驾驶时间。

为了检索该信息,Alexa必须知道将天气请求的位置映射到路线规划功能中的目的地变量。这说明了自我感知的另一个方面:跨上下文跟踪信息的能力。

这种能力是我们开发的夜间外出体验的核心,该体验让客户参与多轮对话,计划完整的夜间外出活动,从购买电影票到预订餐厅和共享乘车。夜间外出体验跨技能跟踪时间和地点,在客户评估不同选项时即时修订。为了构建该体验,我们利用了Alexa对话服务的机制,该服务使开发者能够快速轻松地创建对话驱动的技能,并且我们借鉴了关于对话状态跟踪的不断增长的研究成果。

然而,自我感知不仅包括对对话上下文的理解,还包括对客户物理上下文的理解。2020年,我们在配备摄像头的Alexa设备上演示了自然轮流发言。当多个发言者与Alexa互动时,Alexa可以使用视觉线索区分客户彼此之间的讲话和针对Alexa的讲话。在正在进行的工作中,我们正努力通过仅依赖声学和语言信号,将这种功能扩展到没有摄像头的设备。

最后,自我感知还需要自我解释的能力。今天,大多数机器学习模型都是黑盒子;即使是它们的创造者也不知道它们是如何工作的。这种不确定性使得可解释或可解释AI成为热门研究话题。

该中心积极发布关于可解释AI主题的研究。此外,Alexa基金(该中心的创业资本投资计划)投资了fiddler.ai,这是一家使用基于Shapley值的博弈论概念技术进行可解释AI的初创公司。

自主学习
历史上,AI开发周期涉及数据收集、数据注释以及在新注释数据上重新训练模型——所有这些加起来是一个费力的过程。

2019年,我们推出了Alexa的自主学习系统,该系统自动学习纠正错误——包括客户错误和Alexa语言理解模型中的错误——无需人工参与。该系统依赖于请求未被正确处理的内隐信号,例如当客户中断响应并重新表述相同请求时。

目前,该全自动系统正在纠正15%的缺陷。但这些都是跨用户群发生的缺陷;只有当足够多人隐式识别相同缺陷时,系统才会解决它。我们正在努力将相同机制适应个别客户的偏好——例如,Alexa可以学习当特定客户要求播放歌曲"Wow"时,她指的不是2019年Post Malone的热门歌曲,而是1978年Kate Bush的歌曲。

今天的客户还可以选择明确教导Alexa他们的偏好。2020年秋季,我们推出了客户交互式教学功能,该功能使客户能够指导Alexa他们希望如何处理某些请求。例如,客户可以教导Alexa"阅读模式"意味着灯光全开,而"电影模式"意味着只开百分之二十。

自助服务
交互式教学也是Alexa如何实现更多自助服务的早期例子。它扩展了先前的Alexa功能,如蓝图(让客户从现有模板构建自己的简单技能)和例程(让客户在单个命令下链接一系列操作)。

2021年3月,我们宣布公开发布Alexa对话,允许开发者通过上传示例对话创建对话驱动的技能。Alexa对话的复杂机器学习模型使用这些对话作为生成更大合成训练数据语料库的模板。从该数据中,Alexa对话自动训练机器学习模型。

然而,Alexa对话确实要求开发者指定新模型应操作的实体集和技能的应用程序编程接口。因此,虽然它需要很少的机器学习熟悉度,但它假设了一些编程经验。

我们正在稳步消除甚至该要求,通过使Alexa开发更轻松和直观。例如,随着Alexa技能库的增长,实体经常被重用,我们已经有了可以通知开发者他们可能没有想到添加到技能中的实体类型的系统。这是向自助服务模式迈出的一步,在该模式下,开发者不再需要提供详尽的实体列表——或者在某些情况下,根本不需要提供任何实体。

另一种使构建机器学习模型更容易的技术是少样本学习,其中现有模型仅使用少量新训练示例推广到相关任务。这是Alexa的一个活跃研究领域:例如,今年早些时候,我们在口语技术会议上发表了一篇论文,描述了一种用于自然语言理解任务的少样本学习新方法。与前辈相比,当每个模型仅用10个示例训练时,我们的方法在某些自然语言理解任务上将错误率降低了高达12.4%。

这些进展,连同该机构科学上报告的其他进展,表明Alexa AI团队继续加速其创新步伐。更多激动人心的公告即将到来。我会不时回到这里,向您更新Alexa进入自主时代的旅程。
更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)或者 我的个人博客 https://blog.qife122.com/
对网络安全、黑客技术感兴趣的朋友可以关注我的安全公众号(网络安全技术点滴分享)

Logo

更多推荐