Uploads%2farticles%2f12944%2f0
|
2019-01-22

一文解构小度车载支架,我们发现了语音交互为蓝牙设备带来的巨大红利

语音交互帮助传统蓝牙设备全面升级,更好地赋能使用场景,延展更多需求

提起蓝牙,这是一个任何消费科技类产品都不可忽视的刚需市场。根据 SIG 2018 年蓝牙市场报告分析,至 2022 年,将有 52 亿蓝牙设备广泛应用到各个行业。而在 2018 年,蓝牙音频设备全球出货量(包含耳机、音箱、车载系统等)是 8.8 亿台。

与此同时,Google、亚马逊、百度、小米等巨头纷纷飚出了赋能设备数字:1 亿,2 亿,5 亿、10 亿...无不预示着语音已成为标配,AI 设备赋能已经进入 2.0 时代。

顺应语音+蓝牙的潮流,百度在 2018 年 11 月推出了小度语音车载支架,几度售罄,使之成为继智能音箱后的又一对话式 AI 爆品,同时也给行业带来了新的生机。

小度语音车载支架这个产品的组成看起来很简单——一款硬件(车载无线充电手机支架)+ 一款手机软件(小度APP)。价格也直接:69 元标准版,99 元无线充电版。

但我们绝不能将它归类为一款主打低价、走低端大众市场的硬件产品。实际上,产品背后的复杂度,透露着百度在语音赋能战场已经进入 2.0 阶段后的布局。要了解巨头们的算盘,就要了解其拳头产品。

按照硬件及算法、平台内容、无线通讯协议这几个部分,我们将小度语音车载支架解构开来:

硬件及算法

芯片层面,小度语音车载支架搭载集成 Cortex-M4 的 BES2000 蓝牙芯片。

算法层面上,芯片接入了小度的 DMA SDK,集成了混响消除、噪声抑制,以及 OPUS 等算法。

支架下方两只腿部的设计,其实是一组双麦克风阵列,用于精准拾音。

针对车载场景,百度还专门对其包括识别模型、唤醒模型在内的语音交互性能做了模型优化,使得设备即使在 80km/h 时速的嘈杂环境下,依然可以保持 97% 以上的高唤醒率。

这些软硬件技术的集成,为设备在确保拾音准确性、音频的稳定传输,以及语音交互的流畅度等各方面打下了重要基础。

APP

小度蓝牙支架上市后,通过对云端用户数据的分析,可以看到:用户平均每天使用小度语音车载支架的时长是 37 分钟,而这些用户平均每次的通勤时长为 45.8 分钟。不难看出,一旦使用了这款产品,用户在车上的大部分娱乐功能都是通过这个设备来实现的。

而从内容服务的使用数据来看,用户对音乐需求的占比达到了 33%,其次是类似「公开课」之类的有声资源。除了娱乐,车内场景的用户刚需还包括通信和导航。

小度蓝牙 APP 将用户的述求及百度相应的能力涵盖进来,以模块化的方式、卡片化的方式呈现在手机 APP 界面中。其能力体现如下:

第一,娱乐能力。小度蓝牙 APP 集结千万曲库音乐资源以及 32 家有声资源合作伙伴千万小时有声内容。特别的,对于用户在娱乐方面分散且多样化的需求,百度做了资源点播以及资源控制方面的优化。以资源控制为例,除了满足类似「快进 1 分钟」这样的控制指令外,「快进到副歌」对小度蓝牙 APP 也不成问题。

第二,地图能力。小度蓝牙 APP 集成了百度地图的基本能力,我们可以直接通过语音向它发起目的地导航,也可以询问附近加油站,查询目的地是否拥堵等信息。

针对导航在车载场景里的应用,百度表示还会将体验做进一步打磨,将音乐与导航结合在一起实现交互的连贯性,让用户在边导航时边听歌,两者互不干扰。

第三,通讯场景。小度蓝牙 APP 可以通过语音直接呼叫手机中的联系人、查询黄页,并且对联系人的名字也做了专项的语音优化。

△ 基于小度蓝牙解决方案的 Doss 智能蓝牙音箱


蓝牙协议

经典蓝牙协议在刚开始加入语音能力的时候,其体验上是欠缺的,其原因是:

  1. 出于成本和功耗的考虑,目前的蓝牙芯片没有引入语音唤醒模块,也导致很多具备语音交互能力的蓝牙设备没有 Hands-free 的体验,都只是通过触碰或者按键去触发语音交互。

  2. 语音交互会有延时。目前具备语音交互能力的蓝牙设备主要是通过 A2DP 和 HFP 播放语音输入,在播放与语音输入之间切换的过程中,需要在不同蓝牙协议之间切换,因此会造成延时。

  3. APP 之间会存在互相干扰的问题。主要表现在大多数蓝牙设备开始进行语音输入时会占用手机的录音通道,以至于在其他 APP 已经使用存在干扰和冲突。

这些加入了语音能力的蓝牙协议都只是披着语音交互的外套,本身没有将语音交互的优化作为重点,因此也没有提供良好的语音交互体验。

小度 DMA 蓝牙协议,是在经典蓝牙协议基础上进行了扩展定义和优化,解决语音唤醒能力,提升语音识别效果,优化蓝牙设备的语音传输效率,将普通的蓝牙外设,变成可语音交互的 DuerOS 终端。其优势是明显的:

  1. 满足多种交互方式。包括近场、远场语音交互,以及触控、按键交互等多种语音交互形式。

  2. 蓝牙传输协议采用 BLE、RFCOMM 双模的方式,可以和 A2DP 同时工作,不占用同一条音频输入通道。

  3. 采用 OPUS 音频压缩方式,即使在恶劣的 BLE 带宽体验(比如2KB/s)下,也不影响语音交互效果(比如确保高的语音识别率)。 集成了 DMA 协议的蓝牙音频产品,可以无缝地与小度 APP 进行交互对接,使用户能够实现流畅的、同步的、双工设定的语音交互,获取资源与服务。

  4. △ 小度语音车载支架技术实现方案

目前,百度开放的 DMA SDK 包含 OTA 模块、唤醒模块、音频压缩模块以及其他蓝牙相关的模块。基于此,设备商可以将 DMA 协议快速的接在自己的蓝牙芯片上,大大减少了开发的人力和时间成本,帮组更好语音交互体验的蓝牙设备快速落地。

优化了的蓝牙语音技术正释放出新的红利信号

无独有偶。

去年 10 月,亚马逊面向消费端推出车载后装产品车载连接器 Echo Auto(售价 49.99 美元)。今年 1 月 CES 期间,亚马逊宣布,这款产品的预定量已经超过 100 万台,预购方式采用的是邀请制。

△ 亚马逊 Echo Auto


在此之前,第一款获得亚马逊 Alexa 官方认证的车载快充产品 Roav Viva 于 2018 年 1 月亮相,与 Echo Auto 同价(49.99 美元),在亚马逊智能汽配销量榜单上的排名常年在数一数二的位置上。

△ Roav Viva


当语音遇见蓝牙,当对话式智能技术与蓝牙设备的市场需求结合,我们能看到这一新市场迸发出来的无限活力。

传统蓝牙设备带来的便利性不可取代,覆盖的三大主流场景包括移动场景、车载场景、家庭场景,都非常适合蓝牙短距离的传输。

在任何场景,用户都是离不开手机的。手机的交互和计算处理优势毋庸置疑,结合语音,可延展蓝牙设备更多的应用场景,满足用户双手被占用时对设备的远程控制,同时用对话式语音点播的方式,获取到更多云端的内容和服务,这是用户的刚需。

蓝牙作为一个连接技术具有普遍的适用性,优化了的蓝牙语音技术,加上基于手机 APP 的便捷的接入方式,为蓝牙设备全面升级提供了可能

巨头已经做好了充分准备,联合上下游合作伙伴赢得这波红利

2019 年 1 月 10 日,百度 DuerOS 在深圳举办了一场小度蓝牙联盟峰会,宣布「小度蓝牙联盟」成立。包括高通在内的芯片商,包括悟空科技、芯中芯、Synaptics 在内的方案集成商,以及包括 Jabra 捷波朗、DOSS 德仕、Edifier 漫步者在内的品牌商,都在联盟企业名单之列。

△运用了 DMA SDK 的 Jabra Elite Active 65t

这不仅仅是一场秀朋友圈实力的会,还是一场面向产业链上下游企业的解决方案说明会,更是百度希望在 2019 年发力蓝牙智能语音市场的誓师会。为此,百度已经做好了充分的准备:

  1. 通过自家的小度产品,验证了对话式 AI 硬件的市场空间和用户需求。搭载百度 DuerOS 的智能设备激活量超 2 亿,小度蓝牙设备一经推出,几度售罄。

  2. 以场景和用户为导向,为产品提供了丰富的内容和技能,搭配便捷的语音交互,满足用户在听歌、导航、点播等方面的不同需求。对于设备厂商而言,则是一次接入,云端持续升级,无需二次开发。

  3. 在对话式 AI 技术领域的积累之上,百度还解决了以前在传统蓝牙设备上不能进行语音唤醒的问题,提升了语音识别的效率,同时也优化了语音传输的效率。

  4. 基于以上验证,百度输出了一套包括 DMA 蓝牙协议和小度 APP 的软硬一体化解决方案,并以 SDK 的方式提供给设备商,并支持生态链上下游定制组合方案。

在蓝牙语音这一被语音巨头开辟的新战场,百度不是唯一的玩家,也不会是要打败所有对手的最终唯一玩家。百度的心态是开放的,希望联合合作伙伴,共同打通上下游产业,令数千万蓝牙设备瞬间变身可对话的人工智能设备,提升用户体验,并实现产业链升级。

这是巨头为设备厂商们准备的新年红利


主笔:林 亿 / 深圳湾

审校:陳壹零 / 深圳湾

>>
Back to top btn