Uploads%2farticles%2f12319%2fea4aa901 3800 44ae a688 a2c4e9b8b2d0
|
2018-05-09

从无聊到有得聊,看 Google Assistant 如何让人机交互更自然 | Google I/O

Google Assistant 长大了,也将面临更多的挑战。

北京时间 5 月 9 日凌晨,Google I/O 2018 在山景城如期召开。

虽然是 Google 将 AI 定义为公司未来发展战略以来的第二个年头,但这次的 I/O 大会却远不如以前那般令人兴奋。「无处不在」的 AI 挑起了本次 I/O 大会大梁,涵盖语音、图像、自动驾驶各个方面。

而在看完整场戏份最足的 Google Assistant 更新之后,我湾编辑就十分放心的去睡觉了……因为,把过去深圳湾(微信 ID:shenzhenware)一年的报道整理起来,基本就是这一次 Google Assistant 的更新了。

首先,我们来回顾下 Google Assistant 从诞生至今所取得的成绩:服务已经覆盖全球超过 25 个国家和地区;目前可控制 5 亿台智能设备(包括手机、家居、汽车等);Actions 数量超过 100 万个。

Google 表示,Google Assistant 计划年底支持 30 种语言,并进入 80 个国家和地区。

然后,我们来看看关于 Google Assistant 的重要更新信息:

帮你打电话预约餐馆、理发店等:

这大概是 Google Assistant 本轮更新的最大亮点。在记录、提醒日程的基础上,Google Assistant 的执行能力已经上升了一个新的层次,它能代替你亲自打电话给理发店、餐厅等进行时间、座位预约。

即便客服说话语句不够连贯,AI 也能听懂对方的意思,甚至还能通过即兴反应和提问达到最终目的。如理想时间预约已满,Google Assistant 会另外退而求其次的约定另外的合适时间点。过程是如此流畅、衔接是那么的自然,以至于对方客服觉得不是在跟一个机器讲话。

另外,在完成打电话的任务后,Google Assistant 会把结果标记在日程上,并给用户发送提醒。

接下来,介绍一些我们「似曾相识」的 Google Assistant 新功能:

新增 6 种不同的人声:

就像手机 APP 往往会提供不同颜色、主题的皮肤给用户选择,Google 也在原有一男一女的声音选择基础上,给 Google Assistant 带来 6 种不同男女声。其中就有一种来自于曾经在《爱乐之城》里出演过的美国歌手约翰·传奇 (John Legend)。

值得注意的是,这些声音背后用到的技术是基于 WaveNet 神经网络的 DeepMind。而相关的 AI 语音 TTS 服务「Cloud Text-to-Speech」已经向个人开发者及企业开放购买(具体可移步 Google 博客官网查看)。在三月份的一篇报道中,深圳湾就曾系统介绍了这一服务。(点击前往了解 WaveNet 发展历程及其详细的工作原理)

多轮对话能力:

在过去,用户每向 Google Assistant 提出一个请求之前都要喊一遍「Ok,Google」,流程繁琐且又显得不够自然(我们大概不会跟家人、朋友每说一句话之前都喊一遍对方的名字),这其实也是许多语音智能交互的一个通病。

而如今,这种情况将得到改变,Google Assistant 新增了多轮对话能力,并能辨别出用户是在跟它对话还是跟别人对话。因多次喊唤醒词而口干舌燥的时代即将过去。

一次性处理两个指令的多任务处理功能:

在自然对话过程中,人们的一句话往往包含多个信息点。为了适应这个情况,Google Assistant 如今能在用户的一句话中同时 get 到两个指令。例如「帮我打开客厅的灯然后播放音乐」、「查找到去餐馆的路线后发给 Lisa」等。而 Google 在去年底就公布这一功能

Kid-friendly:

在人员构成复杂的家庭场景中,语音智能产品(如智能音箱)必定要迎合不同家庭用户的使用习惯。

针对儿童用户,Google Assistant 先已经接入 13 万小时的儿童故事音频内容。

另外,通过人机交互,Google Assistant 还能从日常生活中让孩子从小培养注意礼节的好习惯。当儿童跟 Google Assistant 对话中用到「please」这个词时,Google Assistant 也会给予更亲切的回应,比如夸赞小孩「有礼貌」等。

更自然的声音+屏幕互动模式:

智能音箱时代过去强调「voice only」的情况已经发生改变,声屏互动成为当下的主流。而除了提供声音上更智能、更流畅的反馈,Google Assistant 在视觉表达方面也得到了不少改进。

以 Smart Display 为例,Google 演示了联想带屏智能音箱的功能:包括视频菜谱、视频通话、摄像监控、Google Map 导航等。「智能音箱里的语音助手只会告诉你这个餐馆在 2 公里以外,那还不如地图显示来得直接」Google 似乎意在表达「带屏幕的智能音箱更有发展前景」的观点。

而以手机为例,Google Assistant 拥有更高度符合场景的表现力,如开车使用 Google Map 时,Google Assistant 可很好的融合在地图页面,为用户提供音乐播放、天气、新闻等语音服务。

其中,Smart Display 基于 Google IoT 平台 Android Things,是 Google 于今年 1 月份的 CES 期间推出的产物。在本次 I/O 大会,Google 还公布了一则其首批合作伙伴的最新消息: 联想,LG,JBL 分别搭载 Smart Display 的产品将于今年 7 月份陆续上市。

登陆 Wear OS

今年 3 月份,Google 宣布 Android Wear 正式更名为 Wear OS By Google 的消息。在这次 Google I/O 大会前,最新版本的 Wear OS 也已经上线,同时 Google Assistant 的更多功能也已经登陆该系统,包括日程日通、智能推荐、家居控制、100 万个的 Actions 应用等。(具体可阅读本次推送的第二篇文章)

在这场盛大的开发者大会现场上,我们可以看到,Google 正通过各种方式的努力让语音人机交互变得更自然,Google Assistant 也离「Her」越来越近。随着所连接设备种类、数量的增长,服务覆盖到各个垂直细分场景和人群,Google Assistant 正身经百战。

>>
Back to top btn