中心化 or 去中心化?智能小家电前进道路上的「中场战事」
角逐智能小家电蓝海市场,AI 企业该做怎样的技术储备和战略规划丨WARE 2019
5G、物联网时代到来,万物皆可+AI
时间倒退到 2014 年底,亚马逊发布首款智能家居控制中心的智能音箱 Echo,连续几年创造了黑五、圣诞期间的销量神话。这股风也随之吹到国内, 2017 年,国内智能音箱市场全面爆发。
作为国内最早一批搭建语音 AI 平台的公司,思必驰也在期间赚取了一波红利,与国内一半的智能音箱品牌达成合作,客户包括联想、阿里天猫精灵、腾讯听听等。
而随着智能音箱战火消停,开发者和厂商开始思考更多应用方向,作为一家 AI 技术方案商,思必驰也要跟随客户的需求,一路探索新的发展方向。由此,引发几点思考:
智能音箱之后,下一个现象级的 AI 爆品是什么?
在移动互联网的时代,智能手机中心化聚合的趋势明显。而在物联网时代,这一趋势发生了什么变化?
5G、物联网时代来临,万物皆可上云、皆可计算,智能小家电的蓝海市场崛起,我们该为这一趋势做哪些技术储备?
在 WARE 2019 第 II 季的峰会上,思必驰 CMO 龙梦竹对以上问题进行了一一探讨,并分享了思必驰在 AI 技术新方向、商业策略方面的思考。
/ / / / / / / / / /
5G、物联网中心化时代,语音平台要做深做透
在语音智能市场爆发之时,互联网巨头、AI 技术厂商纷纷打造 AI 平台,即提供从前端拾音、信号处理、识别、理解,到背后的知识图谱、AI 技能、TTS,以及语言输出的全链路智能对话技术,并且为设备厂商提供超高度的个性化定制能力。
2017 年,思必驰推出了 DUI 开放平台,用以赋能更多的产品类型和更个性化的需求,开始了推进语音应用规模化的道路。
此前,与大部分友商类似,思必驰采用项目制的模式,接收各个合作厂商的需求,进行 One by one、一对一的开发。
现如今,不仅仅是因为智能音箱,互联网巨头、AI 技术厂商打造的 AI 平台更多的是为 5G、物联网时代的到来做储备,主要赋能手机、音箱、电视等中心设备,因此 AI 平台也普遍被称为物联网方向的 APP store。
在这样的背景下,平台厂商、AI 技术厂商的一个重要发展方向是,将技术做深、做透,将更高水平的 AI 能力聚合在一起,满足日后更深层次的需求。
万物+AI:去中心化时代来临,智能小家电是正在发展起来的蓝海市场
在移动互联网时代,手机作为中心设备,聚合内容和服务,形成了中心化聚合的趋势。而随着 5G、物联网时代慢慢逼近,这个趋势发生了变化。
智能音箱普及,让 AI 顺利渗透到人们的日常生活,也让更多开发者和厂商开始思考更多应用方向:让 AI 走进智能家居、汽车、户外、酒店、以及公众场合等等。
对于 AI 方案商而言,万物互联的新需求也给他们带来新的机遇和挑战:除了音箱、手机等具有强算力中控芯片的中心设备,还有很多智能设备、小家电,小到耳机、大到空调,无法像智能音箱那样承载全链路的云端语音交互。
这时候,用端侧计算、边缘计算,轻量化、更小、更快的 AI 赋能方案应运而生。
过去,随着马桶+语音、红酒柜+语音、门锁+语音等厂商需求找上门,思必驰为之一一提供「小而快」的 AI 赋能方案。
这些源源不断的新需求也证明,智能音箱之后,智能小家电是一个正在发展壮大的蓝海市场。
新的趋势凸显:在物联网时代,万物皆可上云,万物皆可计算,所有设备都可以进行 AI 交互,万物都有可能成为中心,这时候,我们就进入了一个去中心化的时代。
去中心化催生新的技术热点
面对智能小家电这个新兴的蓝海市场,除了「小而快」的赋能方案,也进一步催生了新的技术热点,包括全双工、麦克风阵列、多设备联动的唤醒机制等等。
全双工语音交互
不同于一次唤醒交代一个指令的单轮交互以及多轮对话,全双工语音交互则是一个更高阶的技术,支持实时对话、边听边想,实时决策,机器甚至可以拥有打断、从而获取有效信息的技巧。
龙梦竹表示,目前,全双工语音交互技术还未达到通用智能的程度,但在某些具体的场景,如在智能客服,以极简式命令为主的智能白电、小家电产品中,都能得到很好的应用。
以空调温度调节为例,「你好,小驰,帮我打开空调,开到 24 度,算了,还是 25 度吧……」这样的交互就是全双工的应用。
麦克风阵列
在过去的智能音箱中,线型麦克风阵列是主流技术。而随着家里的智能设备越来越多,尤其多个设备采用统一的唤醒词时,就容易出现「一呼百应」的状况。
分布式麦克风阵列的出现即解决这种场景,基于用户的声音反馈以及意图,实现就近唤醒。
多设备联动的唤醒机制
在全屋智能场景下,除了就近唤醒,多设备联动也是新技术热点,包括:
正面唤醒:可以通过近距离交互方式,面对面地唤醒设备以避免多设备误唤醒;
就近唤醒:在多个设备距离用户较近的情况下,通过计算声波到达设备的时间差,对同一唤醒词的多款设备进行空间计算,利用二级唤醒机制来唤醒距离用户最近的设备;
语义选择:基于 one-shot 云+端混合识别技术,实现本地唤醒词和云端识别语义一体化,基于用户语义分析用户意图,以唤醒相应设备。比如当听到「你好小驰,打开空调」的语音指令,只有空调会响应,其他采用同一个唤醒词的电视、冰箱则保持沉默。
多模态直视唤醒:模拟人与人眼神交互的特点,唤醒用户需要交互的设备。
低功耗是普遍的需求
AI 等性能的提升,都不能以牺牲功耗为代价。
针对智能白电、智能小家电和智能穿戴等设备,思必驰在今年推出了低功耗算法方案,帮助小设备快速赋能 AI。
结合产品应用场景,根据硬件结构评审和声学评估结果,思必驰低功耗算法方案提供相应的单项/组合项算法方案,主要可分为一级低功耗唤醒,二级唤醒验证,三级声纹验证。
三个月前,深圳湾就曾与思必驰探讨低功耗算法在手机、家电场景的应用。这一回,思必驰跟我们透露了其低功耗方案的最新进展:过去已推进技术在个别产品的落地,随着技术落地得到升级和完善,思必驰对客户需求的服务也有了明确的分类,针对近场交互设备、手机、耳机、儿童故事机等终端,均已有成型、能够快速运用的低功耗解决方案。
针对只有拾音需求,没有放音需求的设备,比如台灯、插座,采用基于 DSP 的一级低功耗唤醒方案。
对于有近场拾音,又有放音要求的设备,比如低端的儿童玩具等小型、单一功能设备,提供小模型语音唤醒方案。
对于有远场拾音需求的设备,比如白电、冰箱、门锁,提供双麦远场唤醒方案。
同时,思必驰的低功耗算法方案能提供定制能力,例如唤醒词定制,根据产品的目标人群年龄特征、地域特征的口音定制,根据产品应用的车载、商场、骑行等场景的噪声环境定制,根据芯片选型、硬件设计等进行灵活组合与定制。
今年初,思必驰历时两年多打造的低功耗 AI 芯片 TH1520 正式亮相。(点阅查看芯片详情:《思必驰发布始终在线、低功耗 AI 芯片,AI 交互智能生态布局初显规模》)
在此次大会,该芯片的进展得到披露:今年 4 月,量产光罩流片,7 月量产版芯片点亮,目前已进入产品测试和对接的阶段,主要的客户为大型白电和小家电设备厂商。
5G、物联网趋势下,思必驰该如何打好这场战?
一家 AI 企业的核心工作,不外乎是垂直深耕技术,推动技术的落地、变现。而落地前的技术适配,针对场景的功能打磨,面临诸多考验。但对 AI 厂商来说,这往往是一个预知市场走向和提前做好准备的机会。
这些经验,让思必驰在商业策略上有了更明晰的目标。 目前,思必驰内部在集中做以下三件事情:
一是,继续建设全链路的语音技术的平台能力(DUI 开放平台)。提供面向音箱、电视、车载、机器人、企业服务以及其他细分领域的定制化服务,给拥有开发能力的厂商和开发者,根据自身需要定制语音能力。
二是,语音技术前沿技术的深度研发。面向「中心化」方向,为更强的平台能力做技术储备,包括自适应、小数据迁移学习等前沿技术。
三是,面向「去中心化」的趋势,为小家电、配件等设备提供快速赋能的语音解决方案。
总的来说,即为 5G、物联网的两大发展趋势,中心化和万物+AI 的去中心化趋势做好两手准备,深耕 AI 技术。
对于自身的定位,思必驰也有了更深的思考:
思必驰是一家市场需求驱动型技术公司,技术厂商是规定不了客户需求的,我们所有的发展和方案输出都由客户决定。