Uploads%2farticles%2f11736%2f          3.024
|
2017-08-16

在先行者叮咚面前,小个子天猫精灵的耐撩指数能打几分?| 深度测评

你们期待的天猫精灵与叮咚 A1 互撩的画面来了……

「在国内,做智能音箱的,基本都拆过叮咚。」

在上个月深圳湾举办的「WARE 2017 语音智能平台与应用峰会 第 II 季」的百箱争鸣论坛中,灵隆科技总经理魏强这般笑称道。虽然是一句玩笑话,但不可否认,叮咚在国内的先行者地位。

在 2015 年,灵隆科技有限公司推出智能音箱叮咚 A1,而其二代版本也将于近期上线。一周前,阿里旗下的智能音箱天猫精灵开售,正式进入国内早已水深火热的音箱市场。

作为国内最知名的两家电商公司,阿里巴巴与京东不仅在每年的双 11 打的火热,其战线也开始逐渐向物联网及人工智能推进,并延伸到当下最火热的硬件产品——智能音箱上。

天猫精灵这款音箱表现究竟如何?深圳湾(公众号 ID:shenzhenware)选取了天猫精灵 X1 与叮咚 A1 两款产品,进行了深入的对比。

一、天猫精灵 X1+叮咚音箱 A1 对比评析

作为目前国内仅有的两款可购物音箱,天猫精灵与叮咚无论是从功能、渠道还是产品定位等角度都具有很强的可比性。此次,深圳湾分别从外观、语音、内容等几个角度深入体验了这两款音箱:

外观

单从外表来看,天猫精灵通体为白+灰色设计,外壳为胶质材料,顶部有一个静音按键,两个音量调节触控键,以及六个麦克风音孔。

而叮咚 A1 外壳则为金属材质,因此箱体较为沉重,外部采用喷漆工艺,色泽略暗;顶部有一个实体静音按键,一个音乐播放/暂停键,两个节目切换键,以及音量调节触控线。

当两款音箱分别被唤醒时,均会出现一个与 Echo 类似的蓝色光环,不同的是叮咚在顶部,而天猫精灵在底部;在调小音量时,叮咚的光环长度会变短,而天猫精灵光环亮度会变暗。

语音

天猫精灵使用自家 AliGenie 语音系统和声纹识别技术,采用思必驰的 6 麦克风阵列技术,搭载联发科智能语音芯片;叮咚 A1 采用的则是科大讯飞的 7+1 麦克风阵列及语音技术,并搭载叮咚开放平台。

音质上,由于叮咚 A1 采用的是一个低频扬声器加上 4 个全频带单元,而天猫精灵只有一个全频扬声器,因此在音质体验上叮咚音箱要更为细腻立体。

语音对话是智能音箱最为核心的技能,这方面我们进行了以下几个方面的详细测试:

A、唤醒测试:分别采用了 0.5 米 、2 米 、5 米三种不同距离进行测试:

  • 0.5 米距离,用同等程度低声唤醒,二者不分伯仲,唤醒率均较高;
  • 2 米距离,用正常声测试时,虽两者均可正常唤醒,但叮咚唤醒率略高于天猫精灵;
  • 5 米距离,两者均需提高音量才能保证唤醒,这一环节叮咚则明显强于天猫精灵,这其中或许也有其口语化唤醒词的一份功劳。
在安静环境下,三种不同距离各测试 10 次的未唤醒次数统计

B、语义识别测试 :TTS 是叮咚的强项,在语义识别准确率上叮咚 A1 也明显强于天猫精灵。

例如,对叮咚音箱说「上山打老虎」,叮咚音箱能正确识别并播放同名音频内容,天猫精灵则推荐了一首毫不相关的歌曲;而改为「请播放上山打老虎」后,才能正确播放歌曲。

C、降噪测试:在用同等音量的音频进行干扰时,用略高于噪音的音量与之对话,叮咚的处理方式是抓取大音量关键词,例如「打车」;而天猫精灵会不断尝试识别所有听到的内容。因此在这一点上,叮咚略优于天猫精灵。

D、多轮对话:叮咚可通过 APP 设置 15s 到 5 min 时长的多轮对话(AIUI),设置后便可免唤醒对话,而天猫精灵则暂时不支持多轮对话。

E、声纹识别:正常对话情景下天猫精灵能准确识别被记录过的声纹,而在同一个人故意变声(包括用尖锐、低沉的嗓音)时,则容易识别失败。叮咚则无此功能。

内容

叮咚的音频内容比较丰富,分类较为详细,主要接入的内容提供商有百度音乐、咪咕音乐、喜马拉雅 FM 等。

而刚刚出道不过两个月的天猫精灵虽也接入了虾米音乐、喜马拉雅等内容,但在内容丰富度及分类上则还需要继续努力

从上图中可看出叮咚的内容资源比天猫精灵更丰富有序。在交互体验上,叮咚支持语音与 APP 两种方式点播内容,而天猫精灵只能通过语音的方式进行点播。天猫精灵的 APP 中能直接看到使用者与音箱对话的文字内容,叮咚则不可以。

不过从应用的角度来看,天猫精灵与叮咚均属于功能型智能音箱,对于带有关键字的指令性任务均有着不错的响应。而当你想在无聊时,像与 Siri 或若琪聊天那样与它进行一场玩笑调侃式聊天,则显得很无趣。

例如分别对叮咚与天猫精灵说「我饿了」,叮咚会说「你可以搜索附近的美食」,天猫精灵会说「我可以帮你点外卖」。而像对话式音箱,例如若琪,则会回答你「可是我不饿呀」,或是「看着你的大腿就不饿了」。

二、核心功能体验:购物与智能家居

作为两款电商背景下诞生的智能音箱,天猫精灵与叮咚有着相似的营销渠道、产品定位。目前来看,叮咚主打内容与智能家居,而在接入了京东商城及中通快递等服务后,也开始有了购物与快递查询功能。

天猫精灵则一开始就推出了声纹购这一杀手锏,是中文语境下首款能通过声纹实现付款购物的智能音箱。此外,天猫精灵也正在快速扩充内容体系与智能家居阵容。

接下来分别从购物与智能家居两个角度评析天猫精灵与叮咚两款产品:

购物

得益于语音识别的高准确率,叮咚能比较准确地根据关键词找到对应的商品,可放入购物车或直接下单(仅支持到付)。但由于没有声纹识别功能,意味着任何人都可以语音下单。如果担心家里的「熊孩子」会瞎买,则意味着每次购完物后都需要通过手机 APP 关闭购物服务。

购物方面天猫精灵的优势则很明显,在录入声纹后,用户能通过特定人的声纹验证完成购物,同时也能为特定的手机号码充值话费,这点的确是比叮咚安全又方便很多。但对于商品名称的区分能力则有待加强,例如对它说「我的购物车里有什么」,它会理解成是想要买购物车一类的商品。

另外,从购物范围来看,叮咚支持京东平台的所有品类的商品购买,而天猫精灵目前的购物范围只是局限于天猫超市。例如你说要买一双运动鞋,京东会推荐一款某品牌跑鞋,而天猫精灵则会说「没有找到你想要的」。

智能家居

阿里与京东都已在不同程度上布局了智能家居。

早在 2015 年 4 月,阿里巴巴成立了智能生活事业部,整合了电商销售资源、还集成了云端数据服务、内容平台,以全面支持阿里智能产品的推进。

京东则在 2015 年与科大讯飞合资成立灵隆科技开始布局智能音箱, 2016 年发布京东微联,开始联合各大家电厂商打造智能家居生态。

目前天猫精灵支持阿里智能与 BroadLink 两个智能平台的接入

阿里智能支持的家电品类及品牌

叮咚的定位就是一款智能家居中枢产品,目前能支持京东微联、美的家居、米家旗下智米等两千多种设备。叮咚 APP 上有支持的智能产品设备列表,点开后直接会引流到京东商城的购物页面。

叮咚 APP 内的家电选择界面

三、技术解析:叮咚语音识别更胜一筹,声纹购是阿里的杀手锏

关于天猫精灵与叮咚各自的技术优势,阿里人工智能实验室负责人浅雪也曾发表过意见:科大讯飞的技术偏重语音识别,而 AliGenie 的强项在语义理解。不同的技术基因决定了不同的产品体验,通过上面的测试我们也能感受到:叮咚在内容搜索上更加精准,而天猫精灵的购物体验更佳

那么这种区别是怎样造成的呢?我们先来了解一下智能音箱包含了哪些语音技术。

智能交互的三个技术层次

当一个产品经理在规划产品中的语音功能时,他需要考虑的绝不仅仅是语音识别,还包括其背后的智能交互。概括起来,表面上看到的智能交互,背后实际上包含三个层次的技术:语音技术、智能化技术、大数据技术。

语音技术:包括语音识别(ASR)、语音合成(TTS)、声纹识别和认证、情感识别等,这是一个将语音转化成文字,并能识别其中包含的语言、情感等信息的过程。

语义技术:包含自然语言理解(NLU)、多轮对话管理、跨领域对话等技术,是一个理解用户意图、感知场景信息,并根据用户过往积累的行为数据做出针对性决策的过程。

大数据技术:包含各种垂直领域(天气、航班、餐馆…)的数据服务,基于知识图谱的信息问答,垂直或通用领域的信息搜索,以及大规模机器学习模型的训练等技术。

语音技术厂商的两大阵营

关于智能语音技术的厂商,目前分为两大阵营:一类是平台厂商,如科大讯飞、百度、思必驰等,以方案商的角色将语音技术赋能到合作厂商的音箱;另一类就是自研技术厂商,如若琪、阿里,并且同时也都推出了自家的智能音箱。

叮咚背后的科大讯飞在智能语音领域已经沉淀了 18 年,背靠中科院、中国科学技术大学这些科研机构,具有强大的人才及技术资源吸收能力,是当下国内智能语音领域综合实力最强的企业。

强大的科研背景决定了科大讯飞在语音识别、语音合成等基础研究领域具有雄厚的实力。站在了「巨人」的肩膀上,叮咚的语音识别能力自然优秀。

相较之下,阿里巴巴在语音领域的布局则晚了很多,到 2014 年才成立了一支语音交互技术团队,起初也只是为阿里巴巴集团以及生态圈中小企业提供智能语音交互服务。

但阿里是何等厉害的角色,在不到三年的时间里就迅速吸收了前南洋理工大学教授王刚等一大批海归技术专家,并秘密筹建了人工智能实验室。

阿里的「决策引擎」及声纹购

浅雪提到的语义理解,其核心体现在天猫精灵的 「决策引擎」机制,通俗来讲就是在理解了上下文意思后,判断应该启动哪一模块响应,并给出最终判断。这一机制最常用在购物环节,系统会根据判断推荐一个最优结果给到用户。

而另一个阿里独有的杀手锏,便是阿里自研的声纹购功能。下图展示了声纹识别技术的原理:

声纹识别原理流程图

原定于今年 8 月上市的叮咚二代将成为灵隆科技首款携带声纹识别功能的智能音箱,但其声纹技术主要用于个性化的内容服务,暂时不会支持声纹购物。而阿里自研的声纹购将在未来一段时间内成为天猫精灵的竞争壁垒。

四、竞争厂商分析:三大派系混战已成一片红海,有能力构筑服务生态者才是最后赢家

其实在智能音箱这条赛道上,中国公司的反应的并不比国外慢。

早在 2014 年,国内就涌现出一批智能音箱「拓荒者」,并出现了国内首款智能音箱「小智」,比亚马逊 Echo 的上市还要早半年。

Echo 的问世,使得一直在业务布局层面对标亚马逊的京东意识到语音智能可能会成为智能家居的一个新的突破口,便火速与科大讯飞合资成立了灵隆科技,并在 2015 年 6 月发布了第一款智能音箱叮咚 A1。

灵隆科技总经理魏强曾在深圳湾采访中提到,京东想要完成在智能家居硬件层面的布局,而主营 B 端业务的科大讯飞也一直想要做一款家庭交互硬件产品,进一步拓宽 C 端市场,于是双方在几次会议后一拍即合成立了合资公司。

智能音箱江湖的三大派系

从拓荒者出现,经历了两年的积淀期,在 2017 年智能音箱市场终于迎来了全面爆发。国内先后涌入了联想、腾讯、阿里、小米、百度等一批实力强劲的互联网厂商,以及上百家传统音箱方案商与创业公司。

纵观当下国内的智能音箱厂商,大致可以分为互联网功能型音箱、内容 IP 音箱,以及传统音箱三大派系

  • 功能型音箱以互联网厂商为主,例如天猫精灵、叮咚均归属电商旗下,其走的是类似 Echo 式的购物+智能家居路线;
  • 内容音箱厂商如喜马拉雅、酷狗,它们没有自研语音技术及硬件基础,但占有独特的 IP 资源,这类厂商目标群体明确,也更加接近用户的实际需求;
  • 传统音箱厂商则有着多年的硬件积淀及渠道资源,他们倾向于以合作的形式跨进人工智能这道门槛,例如猫王与 DuerOS,漫步者与阿里巴巴。

语音智能生态才是核心

上面提到的三类厂商定位均很明确,但与内容厂商的单线突破,与已有用户基础的传统厂商相比,阿里与京东面对的挑战,则是如何依靠电商本身多样化的服务生态,打造以购物+家居为核心的完整服务体系。

这也是一条亚马逊正在践行的道路,尽管 Echo 的销售量已经突破千万台,但亚马逊依旧在马不停蹄地打造以 Alexa 为核心的智能语音生态。据统计,Alexa 已经拥有超过 1.5 万项语音技能,赋能给了超过 7000 家硬件厂商,这才是 Echo 真正的竞争力所在。

据统计截止 2017 年 7 月,外媒 Voicebot 称 Alexa 一共拥有 15069 个技能,根据亚马逊官网可分为如图 19 类技能

一个完整的语音生态不仅仅包含前端的语音交互技术、硬件方案,更包含后端完整的语音技能商店、强大的云端数据处理能力,以及开放给各方硬件厂商及个人开发者的的开放平台。

眼下叮咚推已经出了叮咚开放平台,并接入了几十家第三方应用商,并将联合一些平台厂商合作开发更多技能;阿里也即将于年底推出 Aligenie 开发者平台,进一步丰富其语音服务生态。

虽然技能数量远远不及 Alexa ,但作为中国最具资源整合力的生态型公司中的佼佼者,阿里与京东会是这场长跑竞赛中不可小视的种子选手。

五、结语:烈火炙烤之下更需深思

对于阿里与京东这样的长跑选手来说,体力好、弹药足,他们在布局一个新领域时考虑更多的不是当下,而是未来。相较之下,一些中小型创业公司的日子则会辛苦许多。

最近在访谈一位早期做智能音箱公司的联合创始人时,对方表示,由于国内不成熟的市场环境,以及资金与技术资源的缺乏,使得这样一家颇具前瞻意识的创业公司没能走到最后。如今这家公司的初始团队已经转型开始做语义技能生态的构建,开始了新一轮的征程。

智能音箱会不会真的成为下一代交互入口,我们尚不能判断。但可以预见的是,眼下巨头相继涌入的局面,会使得人才与硬件资源迅速向大公司靠拢,行业烧钱的速度也会加快,那些中小型创业公司也将面临更多的压力。当下市场确如烈火般炙热,但从业者也更需多一点深思。

>>
Back to top btn