Uploads%2farticles%2f11951%2fdsc03558
|
2017-12-05

我们试了试 DuerOS 的手机助手,觉得百度意不在此

11 月 16 日的百度世界大会上,百度 CEO 李彦宏展示了一段用语音控制手机浏览新闻的视频。在这段视频中,李彦宏一边吃饭,一边用手机百度收听资讯播报,仅靠语音便完成了下一条、查阅百科、返回、调节音量等一系列操作,从头到尾都没有触碰手机。

在这段视频效果背后提供支持的,是百度 DuerOS 为移动端 App 提供的最新 TTS 解决方案,在 AI 的移动应用方向上,DuerOS 再次加注了筹码。

在移动硬件端,DuerOS 此前已和 HTC、vivo 等手机品牌达成合作,今年早些时候发布的 HTC U11 以及去年底发布的 vivo X9 都预置 DuerOS 提供的语音智能手机助手服务。

HTC U11+

11 月初,HTC 又在台北发布了最新的「全面屏」手机 U11+,同样搭载了由 DuerOS 支持的小度助手服务。深圳湾(公众号 ID:shenzhenware)对手上的一台 HTC U11+ 进行了简单的测试,看看其上搭载的小度助手表现如何。

深度集成,随时唤醒的手机助手

与 U11+ 上的其他「预置应用」不同,小度助手的服务是被直接集成于 ChinaSense 系统中的,用户可以直接长按 Home 键来唤醒小度助手,也可以使用 U11+ 的 Edge Sense 功能,通过按压边框来唤醒。此外,在开启并设置了语音唤醒功能之后,可以在绝大多数界面(包括息屏)通过「小度小度」唤醒词来唤出小度助手。

用户可以在「设置-小度助手-唤醒词训练」中用自己的声音训练唤醒词,进一步提高语音唤醒率。

一段简单的测试

小度助手提供的功能包括拨打电话、设置闹钟、发送短信、查询天气、手机设置、打开应用、地图导航、附近美食、百科问答等等。

前面的几项对手机助手来说都是入门级标配,小度助手的表现也十分出色。我们重点尝试了附近美食和百科问答两项功能。

餐厅推荐

此前,附近美食推荐的功能曾被多次被当做范例来展示 DuerOS 多轮对话能力,在这个场景下,DuerOS 能够基于用户的多轮命令,从多个维度多种标签来为用户层层筛选适合的餐厅。

可以看到,筛选维度和标签非常多样,小度助手会在一轮轮对话中继承上轮对话的筛选条件,最终帮助用户挑选到最适合的餐厅。

由于手机麦克风硬件的限制,Edge+ 上的小度助手不支持语音打断,在测试中我们使用了 Edge Sense 打断小度提出新的命令,同时,Edge+ 上的小度助手对吐字清晰度要求还是比较高的,如果吐字不清没能准确识别,会导致小度将用户的话理解为其他意图,进而跳出之前的多轮对话逻辑。

百科问答

百科问答也同样是 DuerOS 的强项,但体验流畅的百科问答功能不仅仅是呈现搜索结果这么简单,除了需要依托丰富的知识图谱体系之外,还需要强大的自然语言理解能力,正确理解用户以各种方式提出的问题,并准确给出答案。

对于被百度知识图谱覆盖到的提问,小度助手能很快给出明确而精准的答案;其他结构规整的问题,能给出较为明确、足以解答问题的检索内容;而对一些形式更为随意的问题,小度多数时候也能给出相关性较高的回复。

AI 手机助手需要好的操控体验和丰富的内容服务

平台化、场景化是百度的 AI 落地战略重要路线,DuerOS 是百度在智能语音领域构建的平台体系,在智能语音场景下,DuerOS 还要继续落地到更细化的场景中,像智能家居、智能车载、影音娱乐等等,其中移动应用也是典型的高频场景之一。

「AI 手机助手」类产品就是智能语音在移动场景发力的「初级形态」。对手机助手来说,我们需要它稳定可靠,操控体验好,内容和服务丰富,能做够多。

在操控体验上,一款好的手机助手要能在需要的时候真正解放双手,用语音控制手机,小度助手现在已经能够开启应用,进行部分手机设置,更进一步的,是像李彦宏所展示的,实现选择、后退或者翻动等等一系列基本操作,这就需要与手机系统更深层次的集成。目前,DuerOS 已经针对 App 提供的 TTS 解决方案,首先在 App 层面上实现这样的操控效果。

而手机助手要足够有用,就需要足够多的内容和服务支撑,Siri 在国内曾一度被诟病不接地气,正是因为能配套使用的内容和服务太过匮乏,DuerOS 在内容和服务的落地化程度方面就有优势得多。

凭借自有的大量资源以及外部接入合作商,百度在 DuerOS 背后构建起了一套相对完善的内容和服务支持体系,同时将这些服务资源与用户 LBS 信息紧密结合,让用户在使用小度助手时能够更加直接地获取到需要的内容和服务,不至于处处碰壁。

DuerOS 的 LBS 周边查询服务甚至已经集成了电动汽车充电桩位置信息

AI 手机助手仅仅只是开始

之所以说「AI 语音助手」是「初级形态」,是因为这类应用毕竟还是辅助人们更好使用手机的功能,是 AI+语音在移动端可能性的冰山一角。

移动场景之所以重要,除了其高频的特点,还在于这一场景集中体现了 AI 移动化、个人化和泛用化的趋势。

在 AI 移动化的初级阶段,以手机助手为代表的战场上,苹果 Siri、Google Assistant、三星 Bixby、微软 Cortana、百度小度等玩家目前看起来似乎还势均力敌,但这场混战已经明显开始升级。AI 在移动端的意义将不再仅仅局限于「更智能的手机声控」,而是各个场景下的 AI 应用,从物联网、大数据、内容源、终端服务等方方面面向个人化 AI 中枢汇集的过程。

手机在其中仍是不可或缺的屏幕、计算资源和连接口,但将不再是用户必须每时每刻盯着看的绝对中心,而将成为「AI+语音+屏幕」新交互逻辑的组成部分。那时,就不再是 DuerOS 这样的语音智能系统去适应手机的交互语言了。

仅依托手机等硬件产品,或单一领域平台的布局逻辑在 AI 移动化的进程中可能将越发缺乏竞争力,这一阶段的游戏,将只属于少数手握数据、布局完整、广开门路的玩家。

主笔:陈凯文@深圳湾

摄影:陈宇凡@深圳湾

Back to top btn