Uploads%2farticles%2f11742%2fanker baidu
|
2017-08-17

从 DuerOS 说起:语音智能技术的认知、落地和未来

百度的人工智能战略,可能是互联网巨头中最接地气儿的。

两年前,我们跟一位人工智能从业者聊天的时候,他曾提到专业和非专业人群对「人工智能」这个词的理解存在相当大的差异。老百姓眼里的人工智能,是电影里那种像人一样有着自主意识随时盘算着毁灭人类的「人造生命」,而在搞人工智能研究的人看来,机器视觉、语义理解、深度学习……这个命题下每一个细分领域都算的上是人工智能的范畴。

如今,当以语音为媒介的人工智能得到越来越多关注的时候,类似的差异还仍然存在。不过,这样的差异已经不是老百姓和从业者之间概念理解错位,而是人工智能从业者当中,在面对技术发展和技术应用博弈时截然不同的态度。

DuerOS 们的任务,是提供便捷应用技术的工具

按照媒体惯用的命名方式,2017 年应该算得上是「语音智能元年」,特别下半年以来,国内的互联网巨头纷纷加大了在语音智能领域的布局力度,DuerOS 作为百度押宝人工智能之后交出的第一份作业,算得上是诸多语音智能平台中最抢眼的一个。

在今年的百度 AI 开发者大会上,百度就提出「DuerOS 要做人工智能时代的安卓」,一个能为产品厂商解决基本的人工智能技术问题、为产品提供软件基础的平台,功能类似于中国版的亚马逊 Alexa。

但许多人工智能产品行业的从业者,更倾向于把这些巨头的人工智能平台简单理解成一种可以塞进各种产品中的通用型人工智能。而现在人工智能全行业的技术基础都还难以支撑这种通用性,「一个『啥都能干』的人工智能系统放到具体的使用场景中,如果缺乏对场景的深度理解和针对性优化的话,到头来可能『啥都干不好』,所以还是选个具体的细分领域做更靠谱。」类似的观点,我们听到不止一次。

但 DuerOS 从来不是这样一个「通用型人工智能」,实际上,在向开发者做介绍时,DuerOS 更常用的描述是「一个至少能够完成基本服务的系统」——定位和姿态比「人工智能中的 Android」还要低得多。

这样的认识上的偏差不能简单地归为理解错误,背后反映的其实是两种截然不同的思维导向。

对以产品为导向的技术型产品商来说,「我想让我的产品达到 10 分的体验,但现在技术只能支持到 6 分,所以我觉得这个现在还做不了,我得另选个至少能达到 9 分的领域。」

而 DuerOS 等技术提供方以技术应用为导向看待这个问题时,就变成「我想支持厂商做出 10 分体验的产品,但现在整体行业的技术水平或许才发展到 6 分,那我先把最成熟的 6 分做到大家都能用,看看能解决哪些问题,同时通过产品化获取的经验,继续进一步的技术优化,力求达到 10 分。

而事实是,这「6 分」的技术确实已经能解决不少问题了。它或许不能像钢铁侠里的 JARVIS 那样给你打点好生活的方方面面顺便还能在你把妹撩汉的时候给你恰到好处的助攻,但要帮你摆脱只有 6 个按键却还要完成 N 种反人类操作的机顶盒遥控器是绰绰有余了。

搭载 DuerOS 的极米 T1 无屏电视,可进行语音交互控制

产品「赋能」并不是非要把电冰箱变成 JARVIS

「赋能」是跟着语音智能被提起的另一个概念——指的是把语音智能作为一种「能力」赋予到各种各样的硬件产品上。但这种赋能并不是在各种传统硬件里都塞进一个智能语音助手,而是指任何在应用新技术之后能带来的体验上的提升。

赋能传统硬件,跟依托人工智能技术打造「人工智能产品」是有很大区别的。以家庭机器人为代表的人工智能产品,实际上是人工智能技术发展催生的新品类,所以人工智能技术层次是支撑整个产品体验的核心。而我们说语音智能赋能传统硬件时,更多是运用人工智能技术,在产品基本功能之上做进一步的体验提升。

而 DuerOS 在其中扮演的,就是这样一个让硬件产品开发者能够便捷地运用语音智能提升产品体验的工具,其最大的价值,可能并不在于把人工智能的边界往前推进了多少,而在于把现有资源整合了多少,把可用门槛降低了多少

DuerOS 与国安广视合作的 G1 机顶盒就是这样一个例子。

这款人工智能机顶盒具备自然语言交流、语音搜索、语音控制、语音点播,图像识别、问询服务等多项功能,但最基本的任务还是解决传统电视「好多台、好多钮、好繁琐、难互动」的操作弊端,让用户动动嘴就可以对电视进行各种操作,在电视这样一个非常传统的领域中,这一升级带来的便捷是实实在在可以感知、切中痛点的。这款智能机顶盒已经在长沙落地,很快便有超过 10 万用户体验到了 DuerOS 带来的智能化服务。

DuerOS 与国安广视合作的 G1 机顶盒

在具体产品和场景落地的过程中,取胜的关键在于发现传统硬件产品在使用时还没有被满足的需求点,这需要对产品和应用场景的充分理解。在传统硬件行业,产品厂商才是硬件方面的专家,要与产品本身的功能、调性、场景特征达到恰到好处的结合,就需要充分了解产品厂商对产品的定义,调查和理解产品厂商的需要内容源是什么,想表达的内容在设备上有没有,分别该如何处理和调整。这种与产品团队的深度对接,也是 DuerOS 现在正在花大力气做的事。

同时,DuerOS 敢自比 Android,很大程度上还在于留给厂商和开发者的定制化空间。一个很现实的问题是,在某些领域厂商和开发者并不想在自己的设备上用他人服务,这种时候,DuerOS 就需要开放更多后台技术支持他们开发自己的服务,降低技术门槛的同时,留足自主发挥的余地,让厂商和开发者在得到足够的对话式 AI 能力的同时,又得以保留产品空间和特色。

赋能产品和教育用户,是同一过程的两个方面

我们注意到,除了国安广视的机顶盒之外,DuerOS 在家庭场景下已经落地的产品还包括智能电视、无屏电视等,这类传统型家庭娱乐终端产品在交互上的可提升空间,也是现在大量智能语音技术商首先盯上的突破口。

手动操作不便的行车场景也一直都是语音智能厂商感兴趣的领域,此前也有厂商推出带语音交互的智能后视镜、智能导航仪等,而百度要做的则是依托于大数据,用人工智能赋能汽车这个品类。DuerOS 扮演的则是这个体系中的交互窗口,通过足够流畅的自然语音交互,单轮和多轮对话等功能,让汽车场景中的人机交互更加自然便捷。

博泰基于 DuerOS 研发的车机 Demo

家居、车载、移动等传统硬件密集的场景,将成为首先打开用户认知的窗口。除了着力构建产业端生态之外,增强用户对语音交互的认识并感受它的便捷,加速市场教育,也是包括 DuerOS 在内的整个语音智能行业努力想达成的目标。

百度不止一次表示,现阶段商业化不是 DuerOS 的目标,认为只要人机交互有一次跃升的改变,实现商业化完全不成问题。语音会让越来越多用户实现全天候的设备连接,无论是广告还是内容,都可能在语音设备上有更多的空间。到了这一阶段,无论是 DuerOS 还是开发者,都会有很大的盈利空间。

但在现在这个阶段,DuerOS 同时完成推动行业生态构建和教育消费市场两方面任务的方式,就是打通一条快速赋能、快速产品化的通道,让人工智能技术能够快速通过各种产品与服务和用户、消费者连接起来。

作为最大的中文搜索引擎,百度很清楚自己的优势在哪里,在人工智能变革的时代,像所有互联网巨头一样,百度期望的也是在最基础的生态上做出自己的优势。

封面图片:Anker 搭载 DuerOS 的智能音箱产品
>>
Back to top btn