Uploads%2farticles%2f11615%2f
|
2017-06-16

深度解读语音技能市场——平台厂商的下一个必争之地丨语音智能特稿

这可能是国内第一篇关于语音技能市场的深度文章。

这可能是国内第一篇关于语音技能市场的深度解读。

1/ 语音智能生态繁荣,缺少不了语音技能市场的繁荣

当我们试图解读「语音技能市场」的时候,就如同 9 年前解读的「应用程序市场」:苹果 2008 年发布了针对 iPhone 的应用开发包,向开发者开放 App Store;同年,Google 发布了针对 Android 手机的应用市场 Android Market,后来改名为 Google Play,Google Play 是一个由 Google 为 Android 设备开发的在线应用程序商店。

如果非要有一个逻辑清晰的定义,我们这样来描述「语音技能市场」这一概念:

语音技能是配合语音这一新型人机交互形式而使用的第三方应用。与触控交互条件下,这些软件应用集合在软件操作系统下的应用程序商店,如 Google Play,Apple Store 等。语音技能市场即是在语音交互条件下的第三方应用的集合,目前主要有 Alexa Skills Kit,Action on Google 等主流 SDK 开发平台下的语音技能应用。

下图是一个对 PC、手机以及语音交互下的硬件设备、操作系统、语音助手、典型应用、应用程序市场的一个概述表格(主要包含了 Google、亚马逊、苹果等在内的大公司):


2/ 语音技能市场的兴起,先从亚马逊 Echo 智能音箱说起

全球语音技能生态发展最成熟的一个市场,当属亚马逊的 Alexa Skills。

2015 年,搭载 Alexa 语音助手的 Echo 智能音箱上市。在美国这样一个基本各家各户都是「big house」的环境下,凭借智能语音交互的新形式以及出色的远场语音识别能力,Echo 获得了市场不错的反响,并且创下了亚马逊自家硬件销量成绩的新高(此前是 Kindle)。

起初的 Alexa 并不被亚马逊列为重点项目,虽然在 2014 年底才被公布,搭载 Alexa 的 Echo 项目早在 2010 年就开始启动了。看似亚马逊的「无心插柳」,背后的付出却远远超出了我们的想象。Echo 全球的销量在2017 年 1 月已超过 700 万台,预计今年将突破 1100 万台。

正因为 Echo 出人意料的成绩,Alexa 在公司内部的战略地位也得到了提高,团队扩充到了上千号人,对产品体验也有着极致要求,例如就为给 Alexa 反应时间降低 2 秒这件事情上,就花去了团队先后近两年的时间。基于大量的用户基础和资源实力,Alexa 的语音识别度也得到大大的提高。

进入 2017 年,亚马逊对 Alexa 的重视程度越发的高涨,从对接各类智能家居产品(扫地机、智能门锁、智能灯泡、智能恒温器等)再到嵌入车载系统、开放 API 接入第三方硬件(手机、机器人、智能手表等)。在今年,亚马逊更是陆续推出 Echo LookEcho Show 等新形式硬件产品。

▲ Echo Show 与 Echo

3/ 从 Alexa 到语音技能开放平台 Alexa Skills Kit

除了硬件的打造和接入,Alexa 还有一项浩大的工程,那就是建设语音技能生态——Alexa Skills Kit(ASK)。Alexa Skills Kit (ASK) 是一个由自服务 API、工具、文件和实例代码的集合,可轻松构建你自定义的 Alexa Skills,然后发布。就跟那些为 iPhone SDK 或 Mac 开发的应用程序相类似。但不同于手机、平板,这些 Alexa Skills 所对应的服务都由语音交互来完成。

2015 年,Alexa Skills Kit 正式开放,起初的 Alexa Skills 仅有播放音乐、设置闹钟、设置提醒、读电子书、遥控智能灯等功能。到了 2015 年底,Alexa 的技能达到了 135 项。

据说,亚马逊发布 Alexa Skills Kit 的最初,开发者反馈寥寥,未推动技能市场繁荣,亚马逊更是拿出了 1 亿美元的开发者奖励计划,鼓励开发者为 Alexa 开发技能应用。

2016 年 6 月,在亚马逊发布 ASK 一周年之际,Alexa 技能数量突破 1000 大关。到了 2016 年底,这个数字涨了 5 倍。2017 年第一季度,Alexa 技能量首次打破了四位数的局面,突破 10000 并成为一个重要的里程碑

▲ Alexa Skills 发展情况(2015~2017)

Alexa Skills 的不断丰富增加了 Echo 智能音箱等硬件的使用范围,除了日常的指令外,Alexa 目前已接入多家商铺的服务,如汽车、星巴克、披萨店等,另外还有各种娱乐游戏。现在,用户登陆 Alexa 账号进入技能应用网页,就像当年逛 Apple Store 和 Google Play 应用商店一样。

▲ Alexa Skills 应用商店

总体来说,Alexa 的技能大致分为两类,一类是辅助、娱乐类功能,另一类则是商业化应用,而这也是开发者进行商业利润转化的一个重要战地

另外,在鼓励丰富内容生态的这件事上,亚马逊也为 Alexa Skills 应用商店提供了类似 Amazon Underground 这样的服务,为消费者提供免费 app,开发者则基于用户使用该应用时长来获得利润反馈。

一位资深智能硬件从业者告诉深圳湾,「亚马逊 Echo 和 Alexa 成功的关键,其实更在于较早的语音技能生态的布局。这个阶段很像 Android 上线后,从 1 万个技能发展到 10 万个技能的阶段。Alexa 正处在快速发展的阶段,在语音识别、麦克风阵列、降噪、语义理解,均已经实现全站语音交互。目前,Alexa 已有 12000 项技能,并主要致力于做开发者生态。这是其他玩家现阶段无法比拟的,或者需要很长一段时间才能追赶上。」

作为开启语音技能生态的先行者,Alexa 已有大量的用户基础作为铺垫,再加上 B 端、D 端(开发者端)的打通,抢占语音技能应用市场的优势已显而易见

4/ 在苹果、微软等巨头组团围剿亚马逊,后劲最猛的要数 Google Assistant 

4.1 最早推语音的苹果慢了不止半拍

除了 Alexa 之外,苹果 Siri、微软 Cortana、Google Assistant 这些由科技巨头打造的智能语音助理中,Siri 虽最早搭载在硬件上且相对封闭,目前尚未有任何打造语音技能生态的相关消息,而苹果打造的语音智能音箱 HomePod 已在前不久的 WWDC 上亮相。

深圳湾第一时间对 HomePod 做了深度解读,结论是苹果无心竞争亚马逊。

▲ 苹果在今年 6 月份的 WWDC 大会上公布搭载 Siri 的语音智能音箱 HomePod

4.2 微软则搭上了 Alexa 这条顺风车

微软方面,则在今年 5 月份 Build 2017 大会中公布了其与哈曼卡顿共同打造内嵌 Cortana 语音助手的 Invoke 智能音箱。另外,在去年 12 月份,微软已将 Cortana 开放给家电、汽车、音箱等相关的第三方硬件厂商。

与此同时,在语音技能 Cortana Skills 这项工程上,微软则采取一个比较省事的办法——提供 Cortana Skills Kit(CSK)套件,让开发者能够将开发的 Alexa Skills 轻松的移植到 Cortana 上,并且这一技术能够实现完全跨平台、跨设备操作

为鼓励开发者,微软在今年 3 月份向 Alexa Skills 开发者发送的邮件声明中表示:「从 Windows10、Android、iOS 和 Xbox 等平台中统计,目前 Cortana 的月活跃度达到了 1.45 亿用户」,旨在让开发者树立起对 Cortana 的信心。

4.3 Google 应该是最上心的了

要在这几个巨头中找一个跟 Alexa 步伐离得最近,那就数 Google Assistant 了。在 2016 年的 Google I/O 大会上,由 Google Now 衍生而来的 Google Assistant 被搭载在 Google Home 智能音箱首次亮相。

虽相比亚马逊同类产品 Echo 面世的时间晚了一年半的时间,Google Home 在进入消费者市场,连接各个智能家居厂商设备上的动作与 Echo 十分的相似。Google Home 搭载的 Google Assistant 也被安插在安卓手机、车载等硬件当中,且节奏把握的十分紧凑。

即便如此,Google Home 还是没能比下 Echo,根据 eMaketer 最近的预测报告,亚马逊已经占领了美国智能音箱 70.6% 的市场份额,而 Google Home 仅占下了 23.8%。不过比起那些需要瓜分剩余 5.6% 的小厂商们来说,其处在的地位已相当可观了。

作为后来者,Google 追赶的步伐则显得更为紧迫。在一年后的 Google I/O 2017,Google Assistant 迎来众多功能更新,包括在显示端中加入文字、图像沟通等新形式,新增日程创建和提醒功能,开发 iOS 版本 app 上线苹果 App Store。

▲ Google Assistant 加入文字、图像等新型沟通方式

同时,Google 还开放 Google Assistant SDK,供硬件厂商、开发者将语音助手部署到其旗下的硬件产品中,如家电、机器人、手表等。这一举措旨在对标亚马逊的 AVS(Alexa Voice Service)。

在对标亚马逊「Alexa Skills kit」这件事上,Google 则加深了 Actions on Google 的应用范围。对开发者奖赏更是拨了一大笔预算:Google 当时还在 Google I/O 2017 大会上面向全球开发者宣布了 Google Assistant 应用开发挑战赛 (Actions on Google Developer Challenge) ,其中,一等奖可获得 2018 年 Google I/O 大会门票、Google 总部参观机会(包往返旅费)和 1万美元奖金;二、三等奖也有 7500 美元和 5000 美元奖金加 Google Home 。

早在 2016 年 10 月,谷歌就宣布了 Actions on Google 计划,让开发者能够在 Google Assistant 上创建应用。不过在那时候,开发者只能基于 Google Home 进行应用的开发

在今年的 Google I/O 开发者大会上,Google 宣布,将 Actions on Google 的应用延展至 Android 和 iOS 平台。开发者可以通过 Actions on Google 开发自己的人机对话应用,并接入到 Google Assistant 中,并且可以被所有支持 Google Assistant 的设备使用( Google Allo、Google Home、Google Pixel 手机、Android 手机(6.0 以上)、Android Wear、Android Auto、Android TV 和 iOS,另外,通过 Google Assistant SDK 创客们还可以将 Google Assistant 功能带到自己的自定义设备上,如树莓派、自动售货机等。)

与亚马逊 Alexa Skills 操作方式大不相同的是,用户在使用 Google Assistant 的 Actions 时,并不需要事先做特别的操作,仅需要发出「OK,Google,Speak/Talk to(Action 名称)(to do sth)」这样的指令即可。

而相比之下,Alexa 在 Skills 调动的步骤则显得更复杂些,用户需要在手机应用端/网页端或语音指令来激活这些应用。在用户体验这一点上,Google Actions 似乎显得更有胜算。

巨头之间的语音技能生态之战似乎就在亚马逊和 Google 之间展开,而两者也各有优势,一个入局时间早且有相当的积累的,另一个则奋起直追并且有着先前 Google Play 的丰富经验,虽在技能数上并未占优势,但后劲却不容小觑。就目前而言,两者还是难以相较高下。

5/ 国内语音技能市场发展情况:多是投资人支持下的初创企业在布局,BAT 稍显平静

就国内情况而言,「语音识别技术发展的起步较晚,除了 BAT 之外,大部分语音技术公司专注于平台和产品的打造,产品化尚不够成熟。从实验阶段的技术,到工程化、产品化,再到开放给第三方合作伙伴、广大开发者,再到培育开发者和技能市场,Alexa 用了 5 年时间,国内即便是百度 Duer OS 也还有不小的差距。」某行内人士说道。

而对于小型的语音技术创业公司而言,并没有像大公司那般有丰厚的资源以及经济实力在语音技术产品化后同时做到将技术开放给第三方、消费大众,而要像 Alexa 那样达到上万个语音技能应用,则意味着更长的时间。

以下是一些布局语音技能应用的国内语音技术公司及其情况:

5.1 硬件产品线布局丰富的出门问问


出门问问的创始人李志飞是 x-Googler,创业后也与 Google 合作紧密:曾获得 Google Venture 投资,为 Android Wear 提供中文语音搜索服务等。

从成立到现在,出门问问一直沿着「AI + 硬件」这条道路展开产品开发和业务拓展,最近的发布会,出门问问推出了全球首个多场景全覆盖的及时联动能力的「问问」虚拟个人助理。

新品「问问」虚拟助理(VPA)已全线覆盖在出门问问旗下硬件产品,包括问问手表 Ticwatch 、问问耳机 Ticpods、智能车载产品 Ticmirror、Ticeye 以及在今年 4 月份发布与 Echo 同品类的智能家居产品问问音箱 Tichome。另外,问问音箱 Tichome 的海外版本也即将搭载 Google Assistant 操作平台。 

在今年 4 月份的发布会中,出门问问宣布,其 AI 免费开放平台(ai.chumenwenwen.com)已向硬件厂商、开发者开放,旨在为更多硬件产品「赋能」。

与 Alexa,Google 等走的路子相似,在给自家硬件、第三方硬件「赋能」之后,出门问问的语音技能商店也即将上线,开发者将可基于问问虚拟个人助理创建各种新技能:

5.2 DeepBrain

DeepBrain 是义语智能旗下主打产品,成立于 2017 年初的义语智能,致力于打造国内第一款机器人 SaaS 平台,对标亚马逊 Alexa。

目前,DeepBrain 接入厂商移动端用户超过 2000w,其他 AI 硬件用户超过 20w,签约合作厂商包括华为、联想、三星、骅星玩具、君正、炬力电子、乐鑫等超过 100 家。

另外,目前 DeepBrain 的线上语音技能超过 1000 种,正处在快速增长阶段,据 DeepBrain 官方预计,该平台的技能数将在年底将超过 3000。与国内其他公司相比较而言,DeepBrain 算得上是国内语音技能生态布局的最早且内容最丰富的一个平台。

5.3 Rokid

Rokid 成立于 2014 年,创始人为阿里背景,公司集结了一波强有力的人工智能技术相关的博士、专家。

2015 年下半年,Rokid 正式推出其打造的第一款桌面机器人产品。

今年 5 月份,时隔两年,Rokid 推出第二代产品 Rokid.Pebble,具备更亲民的价格,目的在于接近消费者。

与此同时,在其举办的一次线上「知乎 live」活动中,Rokid 公布了其已建立社区,并在 6 月份向开发者开放 Rokid 的软、硬件平台这一消息。从该公司官网可看到,Rokid 已打开供开发者创建技能的入口:

其次,Rokid 表示,该开发项目也将开放给中小企业,与 Google Home,Echo 的布局策略相似,Rokid 目前已与不少物联网和智能家居企业合作,在 to B 端的市场积极探索。

当 Rokid 的 AI 平台可以让开发者实现快速开发,从而提供给 C 端用户更加丰富的语音技能应用,Rokid 就能在 to B、to C、to D 三维一体中打造属于 Rokid 的语音技能生态。

5.4 海知智能

成立于 2015 年的海知智能是行业内不多的专注于中文语义理解环节的创业公司。今年 3 月份,海知智能推出了其历时 3 年打造的 ruyi.ai 平台,ruyi.ai 是一套自然语言理解和知识图谱开放技术平台,可以为智能硬件、智能机器人和企业智能化提供机器人大脑服务。

搭载 ruyi.ai 个性化机器人大脑平台的有张小盒、墨馨、娃娃亲亲等为代表的智能机器人产品,以及在今年 3 月份亮相新华社新闻报道现场的机器人实体机器人见习记者 i 思(英文全名:Inspire)、过去曾为网红的贤二机器僧。

目前,据相关人士透露,海知智能已正在布局类似语音技能开发的开放平台。

5.5 图灵机器人

图灵机器人是以语义技术为核心驱动力的人工智能公司,致力于「让机器理解世界」,产品服务包括机器人开放平台、机器人 OS 和场景方案。

2015 年 11 月,图灵机器人正式发布一款人工智能级机器人操作系统—— Turning OS。Turning OS 是一款机器人专属操作系统,能够让机器人具备和人类一样的思维能力、情感能力和学习能力,并让机器人采用拟人的方式与人类进行交流。其与传统操作系统不同的是,Turning OS 提供多模态交互方式,运行思维强化引擎、情感计算引擎和自学习引擎。

在 2016 年 7 月的首届图灵机器人创新大会上,图灵机器人 CEO 俞志晨发布了 Turing OS 的升级版本 Turing OS 1.5,增加了 11 项机器人视觉能力,在运动控制和硬件模块实现增强。

据悉,Turning OS 已经有五十多万企业和开发者用户。

附:以上各语音技术公司情况一览表

5.6 国内 BAT

国内大公司体系内,涉及智能语音技术的主要有 BAT,搜狗等互联网高科技公司。而其中最有可能布局语音技能的就是百度、腾讯。

2015 年 9 月,李彦宏在百度世界大会中正式推出其旗下智能语音助手度秘,并宣布让这个语音助手「无处不在」的愿景。

在 2017 年 1 月 CES 大会期间,百度推出了人工智能操作系统 DuerOS,并公布首款搭载该系统、由小鱼儿科技打造的「小鱼在家」。

目前,DuerOS 已经具备 7 大类目 70 多项能力,广泛支持手机、电视、音箱、汽车、机器人等多种硬件设备,除了能实现语音控制、聊天功能,该系统还直接提供多种 O2O 服务等的智能化转变。

腾讯方面,在今年 4 月份推出智能语音助手「腾讯叮当」,服务于腾讯生态下的软、硬件体系,包括旗下各大应用软件,以及智能手表、耳机、电视以及各类形态的机器人。

紧接着在 5 月份,腾讯云小微正式上线,这是一套腾讯云的智能服务系统,包括小微硬件开放平台、小微 Skill 开放平台和小微服务机器人三大平台。

其中,小微 Skill 开放平台(https://xiaowei.qcloud.com/index.html)已接入 QQ 音乐、腾讯视频、物联等腾讯自有应用,以及天气、新闻、笑话等服务内容,第三方开发者也能在平台的基础上创建自己内容。目前,该平台正在内测中。接下来,腾讯方也会有进一步的消息。

就目前而言,包括 BAT 在内的大公司或多或少有在酝酿开放语音开发平台的事情,部分公司尚未有这方面明确的消息。但毕竟对于这些手上掌握大量资源且聚集大量人才的大平台公司而言,要做语音技能生态并不是难事。

6/ 思考:语音技能生态的喜与忧

尽管不少人认为,语音交互将成为下一代革命性的人机交互形式,语音交互的潜力会不断被挖掘且成为一种趋势,但目前这个市场仍还存在一些担忧和问题。

据了解,亚马逊 Alexa Skills 平台上虽然有上万种技能,但存在同类功能的应用达到上百上千个的情况,甚至有部分技能处于「无人问津」的状态。在用户使用率并不高情况下,用户留存率更是这些应用面临的难题。

▲ Alexa Skills 各个类型应用占比图

Skills 对于语音技能系统来说,就像 Android、iOS 系统里的软件应用一样,而丰富、实用/有趣的技能是吸引用户使用该语音系统的重要因素。

在和几位智能硬件老司机的交谈中,我们获得了一个很重要的观点:语音技能平台发展起来的原因并不在平台本身,而在于有好用的 Skill,而这跟目前的 app 平台相似。好的 Skill 并不单单只存在某个平台上。另一方面,平台的繁荣也依赖于设备端,就如当年的 iPhone 一样。

其中一家较早布局语音技能开放平台的公司则表示,他们也曾在开放的路上走过不少弯路,而开放平台成功的关键也不在于做的是否足够早,也不在于拥有多少开发者,而是如何将技术进行商业化落地。

总的来说,语音技能生态建设任重而道远,可能远比 Android、iOS 所经历的坎坷多。

>>
Back to top btn