Uploads%2farticles%2f13797%2f640 148
|
2020-02-12

从 AI 到 AR,下一代交互落地的样子 | 对话 Rokid 祝铭明

AR 爆发......今年是起点,我们还需要 5 年。

赶在农历年前,在西溪湿地北大门正对面的西溪壹号,开张了一个面积不大的「若琪科技馆」——不需要专人讲解员,佩戴好最新发布的 Rokid Glass 2 参观,可以了解所有「馆藏」背后的故事。

故事本身并不重要,更重要的,这个馆是作为 AR 眼镜的典型应用场景,让来访者对于 AR 技术的落地,能有更为生动的认识。

在展馆的门前,悬挂着两面旗帜,分别打着两个主题词——AI 和 AR。而在这两个主题词的下方,则是 Rokid 的两款「尖刀」产品:Rokid Alien & Rokid Glass,音箱和眼镜。

能为自己同时打上 AI 和 AR 的标签,同时拥有在语音和视觉的核心技术,并有能力推出一系列的软硬件产品,这对于 Rokid 这家成立仅有 5 年的创业公司来说,并不容易。

为什么 AI 之后是 AR?

早在 2015 年底 2016 年初,伴随着 Rokid Alien 的惊艳亮相,与众不同的外观设计、两个字的唤醒词、出色的人声,Rokid 颠覆了当年流行的家庭陪伴机器人的形象,甚至引领了次年才开始流行的智能音箱的设计。

随后,顺应了智能音箱的大潮,Rokid 还陆续推出了 Rokid Pebble 和 Rokid Me 等多款设计独特的智能音箱,并以语音 AI 开发板和 AI 芯片为载体,逐步开放了其全栈语音解决方案。

△ Rokid Alien

而正当人们在期盼其下一代「语音」产品的形态和能力时,Rokid 已经跳出了这个圈子,开始大秀其「视觉」能力:从 CES 2018 后,Rokid 陆续亮相了 Rokid Glass、Rokid Vision 两款智能眼镜。

我们可能不止一次的和 Misa 聊过,为什么在 Rokid Me 之后,没有其他音箱产品的规划?Misa 很肯定的回答:

相比智能音箱,AR 想象空间更大。

AR 将成为手机之后新一代交互平台,而 AR 眼镜则是继 PC 和智能手机之后的下一个可以承载人机交互的最佳产品形态。

在众多的 AI 公司里,Rokid 是为数不多的从语音直接转向做 AR 的公司。没有去做诸如时下大热的 TWS 耳机、或相对容易一些的音频眼镜的产品规划,而是直接切入 AR 眼镜,这可行吗?

对于 Rokid 而言,无论是技术储备还是产品规划,做挑战最大的,走在交互创新的最前面,才有机会。

△ Rokid CEO Misa

AR 眼镜离消费市场还有多远?

很多人受到了科幻电影以及一些硅谷先行者的熏陶,对 AR 眼镜有很高的期待。尤其是在 Google Glass 过早在大众市场进行高调宣传后,人们对于 AR 眼镜的第一反应就是它应该是像手表、耳机、眼镜一样,是日常可穿戴的。

△ Rokid Vision & Rokid Glass 2

但现实是迄今为止仍没有一款 AR 眼镜真正量产走向消费者。即便是苹果公司的 AR 眼镜,也迟迟没有推出。AR 眼镜离消费市场还有多远?

消费者的期待很大,与硬件能够达到的能力,相差还是很远。toC 可能还有 3-5 年的时间,就算你拿 100 亿补贴砸进市场也是无济于事,消费者还是不会买单。

既然 AR 眼镜的现实情况是硬件和软件的挑战都很大,Rokid 会如何做?

AR 产业空间巨大,在爆发节奏上,toB 硬件将先于 toC 硬件,在 toC 硬件成熟之前,Rokid 将聚焦于商业领域的应用与落地。

Rokid 要做的,是在 AR 普及的早期,将产品进行沉淀,把软硬件和交互体验打磨到最好,即便是在行业应用领域,也要有消费级一样好用的体验。

那么 AR 眼镜真正普惠大众,需要多长时间呢?

今年是起点,我们还需要 5 年。

为行业设计的 AR 眼镜应该是什么样子?

对于进入行业市场,有一点很重要:

并不是产品有硬伤,就只能退居行业市场,而是行业市场的需求更大。

最新发布的 Rokid Glass 2 是一台面向行业市场的 AR 眼镜,采用分体式+可折叠设计,支持免唤醒语音,支持触控和头控多模态交互,并为行业用户提供了诸多扩展能力。

为什么 Rokid Glass 2 是「为行业而生」呢?

因为在产品设计之初,几乎所有对前代 Rokid Glass 的迭代更新和功能定义,需求都是来自行业客户。

这样一来,当我们拿起 Rokid Glass 2 和一代眼镜对比是,很多问题就有解了:

△ Rokid Glass 1 & Rokid Glass 2

为什么将原来的「一体机」方案替换为不够炫酷的「分体式」?

每一个技术的每一个链条和分支,都蕴藏着许多有待挖掘的应用,而这些应用场景的想象空间也远比我们想象中的要大。客户需要长续航。增加了的 Dock 不仅内置了 10000mAh 大电池,延长续航时间长达 8 小时,还支持 4G、GPS 等扩展模块,以满足不同行业的特定需求。

为什么要有免唤醒的语音操作?是因为黑科技耍酷吗?

因为工厂需要。在安防、工业等场景,用户「只能动口,不能动手」的需求摆在那里。

为行业设计的 AR 眼镜体验如何?

在现场的工业场景演示中,我们看到「工人」可以通过语音命令「我的相机-拍照」操控 Rokid Glass 2 拍照;如果需要查看图片或者文件时,也可以直接使用语音调出文件;同时,语音命令词并辅之以头部姿态控制,实现图片的放大、缩小、翻页、锁定画面等操作。

这一系列的炫酷操作的同时,「工人」的双手都是解放出来的,并且基本能够实现话音一落功能便实现的效果。

甚至,在增加了工业场景的刺耳噪音后,Rokid Glass 2 仍能准确拾取佩戴者的指令声音。而在遇到故障的时候,语音连线中央控制室的「同事」进行云端远程协助,视频和声音画面的传输亦能做到实时。

△ Rokid Glass 的工业应用场景

这些,恰恰是头几年 Rokid 在语音离线识别、免唤醒、近场定向、降噪等技术积累的体现。

Rokid 的新品是否代表了目前行业的最高水平,你们体验后就知道了。

Misa 带着我们熟悉的骄傲,自信的说。

从行业中来,又如何落地到行业中去?

像开篇提到的科技馆,乃至展览馆、博物馆,就是 Rokid Glass 的典型应用场景。除此之外,安防、工业、教育等行业还有很多 AR 眼镜的用武之地。

作为经历过 PC 和手机产业革命的人,我认为 AR 产业的增长,将会首先从中国开始。

Misa 带着团队抓着这一波机会,一手打磨产品体验,一手推动产业落地。

从去年 Rokid Glass 小规模量产后,我们就陆续看到很多案例:成为乌镇互联网大会安保战略合作伙伴,宣布与菜鸟战略合作落地物流行业,亮相赛诺菲首届数字医疗创新峰会试水 AR+医疗,被司法部部长点名助力 AR+智慧戒毒......

△ Rokid Glass 在乌镇互联网大会安保场景的应用

就在春节期间,在举国上下都在抗击新型冠状病毒肺炎的疫情的时候,Rokid 向疫区一线执勤人员送出了 AR 眼镜设备及相应的配套应用软件。

△ 2020 年 1 月 30 日,衢州常山高速口防疫检查站,执勤人员利用 Rokid Glass 对来往车辆进行核查

在防疫检查站点,执勤人员佩戴 Rokid Glass,就能够在一米的距离外,避免跟车内人员的直接接触,而快速识别通行车辆和人员的信息——通常 1~2 秒就可以确定一个人的身份,特别是户籍身份,判断是否和疫情高发区存在联系,识别潜在风险。

△ 2020 年 1 月 30 日,杭州留下检查站,执勤人员利用 Rokid Glass 对来往车辆进行核查

Rokid Glass 针对暗光、动态环境进行了专门优化。即使天色变暗,依然能够保持 90% 以上的识别率。

△ 专为 Rokid Glass 2 配备的一套近视镜片

为了实现更好的用户体验,Misa 说:

产品场景还需要在一线继续打磨。


微信号:shenzhenware

主笔:陳壹零 / 深圳湾

编辑:森林木 / 深圳湾

>>
Back to top btn