Uploads%2farticles%2f12830%2fimg chanpiin auto
|
2018-11-28

五问要做语音版的 iOS 的蓦然认知,如何打造语音交互应用闭环

11 月初,蓦然认知上线了一项全新的服务——基于语音交互的电视版网易严选。在此基础上,用户可以直接使用语音在电视上购买生活、家居、服装等一系列用品。

电视版网易严选图片,技术方案由蓦然认知提供

实际上,「语音版严选」只是蓦然认知的语音智能应用生态中的冰山一角。目前,蓦然认知已接入了 40+ 服务,覆盖了内容、O2O、LBS 服务、电商及其他等 5 大类应用,从我们熟悉的查询天气、新闻,到叫外卖、买衣服、买电影票,再到加油、停车等等日常事项,都可以直接通过语音来完成。

用蓦然认知创始人 & CEO 戴帅湘的话来说,蓦然认知做的是将人们吃穿住行娱乐整个生态服务打通的连贯场景服务,为用户提供全语音对话的智能化服务。

对此,我们与戴帅湘聊了聊蓦然认知对于语音交互中的应用、场景等方面的思考,以及如何打造语音交互应用闭环。

一问系统:打造语音版的 iOS

在多个公开场合中,戴帅湘表示,蓦然认知想要打造的是,智能语音界中的 iOS。成立之初,蓦然认知创始人戴帅湘就提出了 DAAA(对话即应用)这一概念,即通过语音对话来分发服务,而 MorUI 就是这一分发机制中的引擎的入口。

为什么是 iOS,为什么不能是 Android?

面对这个问题,戴帅湘为我们列举了 iOS 系统的几大特征:统一的应用形态、统一的账号体系,以及多设备间相互协作。在戴帅湘看来,这几大特征正是保证 iOS 良好的用户体验的基石。

而在语音交互中,要确保用户有良好的用户体验,同样也需要这几大特征——围绕用户不同时间段的需求,通过一个通用的超级账号,将移动互联网上的服务生态迁移到了客厅、汽车等多个场景中,为用户构建全新 AI 服务生态。

正如苹果通过一个 Apple ID 将不同终端上的应用和服务打通一样,蓦然认知也打造了一个基于手机号码的账号体系,通过一个统一的账号,用户可以多个设备(如电视、汽车等)上登陆使用。如此一来,用户既不需要再面对「记不住账号密码」的困难,设备与设备之间隔阂也得以打通,用户在不同终端上的应用和任务都可以实现无缝迁移,实现跨终端的任务操作。

二问场景:打破家与车的空间壁垒

以语音交互最高频使用的两大场景——家居和汽车为例,以往大家在谈「车家互联」时,更多的关注点都在于如何打破家与车的空间壁垒,实现在不同空间场景下的设备控制,比如让用户在车上控制家里的智能硬件、在家中对汽车进行控制实时监测。

随着蓦然认知统一的账号体系的正式落地,「车家互联」除了可以打破这一空间壁垒,同时也把用户个人的应用和任务在各个空间场景做了一次无缝衔接。举个例子,当用户在家中的电视上购买了一张电影票,但因为时间来不及需要马上出门,用户可以直接离开并在手机上继续完成支付流程;而到了车上,系统可以自动将电影院的地址在车机屏幕上显示出来,并主动询问是否要导航去该地;而在前往目的地的过程中,系统可以为用户推荐目的地附近的停车场等。

值得一提的是,针对目前客厅等场景可能存在一个账号可能对多个用户的情况,蓦然认知在手机账号认证的基础上,增加了声纹识别认证,在需要查询账户信息、购物车或者支付等私密信息时,用户需要通过声纹识别或手机 APP 方可查看。此外,采访中,戴帅湘还透露,未来,蓦然认知还可能根据不同场景的需求,引入指纹、Face ID 等认证体系,来保障用户的账户安全。

同时,基于这一账号,蓦然认知对于用户画像的精度也进一步得到了提高,并深化了 AI 对用户的理解,为服务的「个性化推荐、千人千面」的决策智能化保驾护航。

三问技能:打通技能与设备、技能与技能的融合

目前,不管是国外的 Alexa 还是国内的语音平台,大家都在做语音技能开放平台,吸引各种开发者来提高自己平台的技能数量和种类。然而,在蓦然认知对语音技能数量并没有那么在意,戴帅湘认为,技能与设备的融合、技能与技能之间的融合可以给用户带来更好的体验。

在技能与设备融合上,戴帅湘认为,同一个技能往往需要应用在不同的终端上,比如有用超大屏的电视、支持触控的车机等,那么在开发中就需要考虑尽可能的兼顾到不同设备之间的兼容和配适问题,让应用在显示和操作方式都保持一致,降低用户在跨终端使用时的门槛,最大程度保证用户体验。

另一层面上,通过第三方打造的语音技能,技能与技能之间是相互隔离的,不能相互跳转。戴帅湘举了一个例子,Alexa 平台上有两个语音技能,一个是找餐馆,一个是订位置,理论上这两个技能是可以相互融合的,但因为技能来自不同的开发者,用户在找到餐馆之后,需要先退出这个技能,在进入定位置的技能进行预约,在实际运营中,这一体验并不流畅。

因此,蓦然认知的做法是,把服务融合到蓦然认知的系统中,并以一个完整的链条提供给用户,打造更加系统化的服务。即,用户在找到餐馆后可以直接进入预定位置的服务中,而当预约时发现该餐馆需要很长的排位时间,可以直接让系统推荐类似的餐馆。

四问技术:输出全栈式技术,打造技术闭环

在系统层面,蓦然认知表示,蓦然认知已经掌握了语音链条上各个环节,包括:语义理解(NPL)、对话系统、学习系统、自动服务对接、语言生成、语音合成、声纹识别、唤醒+离线命令词、远场降噪、语音识别等。

基于这一系列技术,蓦然认知面向 B 端客户输出一整套完整的解决方案,并以开放、灵活、定制化的合作方式,为客户提供一站式、软硬一体智能语音交互解决方案。

蓦然认知核心技术版图,资料由蓦然认知提供

五问商业模式:聚焦家居和车载

「出于环境嘈杂和隐私等方面的考虑,国人通常不习惯在大庭广众之下使用语音,家庭和车载这两个相对私密的场景可作为一个较为折中的切入点。」

这句话来自一年前戴帅湘与深圳湾的对话。彼时,国内市场「百箱大战」如火如荼,BATJM 等互联网巨头争相入局推出自家的智能音箱。面对火爆的市场,戴帅湘在接受深圳湾的采访时明确表示,蓦然认知将主要瞄准两类业务:电视和车载。

一年后,当我们重新看回当时与戴帅湘的这段对话时,蓦然认知在家居和车载两大应用场景中均已成功落地。在家居场景,蓦然认知已经与康佳、TCL 等多家知名家电厂商达成合作,并拥有了不错的口碑;在汽车场景下,蓦然认知已与主机厂达成合作(但暂不方便对外公布),预计 2018 年年底可以小批量试产。

而在未来,蓦然认知想要做的,是构建全新的 AI 服务生态。基于蓦然认知的自有全栈式语音 AI 技术,打通车与家之间的空间壁垒,实现语音交互应用闭环。

one more thing

12 月 4 日,蓦然认知创始人戴帅湘将出席 WARE 2018 III 智能影音产业链融合峰会,将帮助我们梳理人机交互变革的过去和未来,分享新交互时代所带来的应用语音化变革,以及蓦然认知这家 AI 公司,在大屏新交互场景下所探索的应用化之路;同时,还将带我们一起思考,主流交互方式的演变带来了什么,以及如何应对因主流交互方式的演变,而带来的产品、技术、以及商业思维的改变。

报名链接:x.shenzhenware.com/2018-3


Back to top btn