Uploads%2farticles%2f16165%2f%e6%88%b7%e5%a4%96%e5%8a%9e%e5%85%ac
|
2023-08-30

看 Rokid 如何玩转空间计算,为 AR 做样板

单目 SLAM、微手势交互、眼神定位、空间搜索,国内首个消费级 OST 个人空间计算平台粉墨登场!

上周六(8 月 26 日)杭州未来科技城国际中心,酝酿已久的 Rokid Jungle 与我们见面了。

秀业绩、发新品、引荐合作伙伴,Rokid团队洋洋洒洒地奏响了新品发布三部曲。

要点回顾:

1、国内首个消费级 OST 个人空间计算平台 Rokid AR Studio 重磅发布,在空间显示、信息呈现与交互、以及操作系统的设计上实现了诸多创新。

1-Rokid_AR_Studio

2、Rokid AR 眼镜服务用户数突破 100 万,每天超过 3 万用户在使用,其中超过 90% 的人使用的是 Station + AR 眼镜组合而不是手机。

Rokid_Jungle_2023_新品发布会-0041

3、移动游戏厅、私人影院、移动办公三大消费级场景,以及诸如文博、工业等产业领域,Rokid 站到了引领全球 AR 的绝对高度,试与走 VST 路线的头盔式苹果 MR 一较高下。

居家办公

4、Google (谷歌) 安卓大屏业务亚太区负责人介绍了全球首款谷歌认证 AR 版 Android TV 设备的诞生过程,称「N+1=Misa」,而其中 N 让大家猜。

image3

5、邀请了众多的合作伙伴,展示了它们为 C 端、B 端、产业端打造的诸多应用案例,把一个下午的发布会塞得满满当当。

游戏场景

接下来我们看看这款代表未来的 AR 个人空间计算平台,实现了哪些我有你无的创新?是否有实力与苹果 Vision Pro 一比高下?

用一颗摄像头完成空间定位与交互

单颗摄像头实现 SLAM,在行业里其实已经存在多年了。但是,在 AR 眼镜上仅用一颗摄像头完成 SLAM、微手势交互、眼神定位,Rokid AR Studio 空间套装做到了。

单目摄像头

Misa 笑称:

至今有很多行业里的从业者不相信用单摄能做到这一点,甚至很多元老级的人物还专门发了文章说单目做不到,我想(如今我们做到了),这也可能算是一种对我们的肯定。

过去,Rokid 面向消费级的两款主力 AR 眼镜 Rokid AirRokid Max 均未安装摄像头,一方面基于成本控制的考虑,另一方面,增加 SLAM 之后对于设备的算力要求很高。

Rokid_Open_Day_2023-0068

△ Rokid Max

Rokid 的思路是用软件定义硬件,通过 AI 算法实现基于单摄像头的消费级 AR 空间交互。

Misa 对此并不胆怯,因为 Rokid 在创立之初就是一家 AI 公司,在 AI 算法领域有多年的积累和沉淀。

Rokid_Jungle_2023_%E6%96%B0%E5%93%81%E5%8F%91%E5%B8%83%E4%BC%9A-0045

基于定制的大视场角摄像头和 AI 深度学习,Rokid AR Studio 能做到指关节级别的灵敏度,虚实贴合的定位精度则达到厘米级。

SLAM 单目算法

此外,使用单摄像头的技术路线更是对苹果 Vision Pro 的一种挑战。要知道,Vision Pro 内置了 8 颗摄像头,是一款重达 500g 的 MR 头盔,而定位为 AR 眼镜的 Max Pro 重量仅仅 76g。产品的可穿戴性是 Rokid AR 眼镜设计之初遵循的基本原则。

值得一提的是,Max Pro 在增加了一颗摄像头的情况下,重量仅比 Max 多了 1g,原因是 Max Pro 阉割了 Max 的屈光调节装置,因此,近视用户佩戴 Max Pro 时,需要额外佩戴近视镜片。

Rokid 在传统的键鼠、语音等交互方式之外,为 AR 眼镜的很多应用增加了微手势的交互方式。我们在现场也做了一番体验,总体上很流畅。

%E6%89%8B%E5%8A%BF%E4%BA%A4%E4%BA%92

浏览内容时,使用手指捏合,即可进行点选。左右滑动,可对界面、内容进行切换。

手势操作

打僵尸游戏时,手指捏即射击,灵敏度和精度不亚于手柄。

zombie shooter

△ 图源:新浪 VR

观看视频时(以咪咕视频为示例),左手手指摊开/收起,即可调整咪咕视频窗口的距离,轻轻滑动,可以让窗口内容滚动显示。

移动vr

还有一个小组件颇受参会者的喜爱,抬碗即可在手腕上浮现一块手表,看时间、看天气,未来还会增加日程计划表等信息。

抬碗手表

重新定义屏幕,空间环境即屏幕

相比娱乐套装,空间套装在显示效果上的提升,是将 Max Pro 的屏幕刷新率提到了 90Hz,从而减少了闪屏和拖影。(注:Max Pro 最高刷新率为 120Hz,连接 Station Pro 使用时刷新率为 90Hz)。

高刷

在旗舰手机屏幕刷新率已达到 120Hz 的情况下,90Hz 对于 AR 眼镜是什么概念?苹果的 Vision Pro 在 3D 模式,刷新率为 90Hz。

但这并不是重点。

AR 空间计算带来的一个重要变化就是:空间环境即屏幕。

怎么理解?用一个日常办公场景来做说明:

我可以在眼前打开多个窗口,像传统的应用方式一样将他们一字排开。

多窗口

然后居中打开一个云电脑。我可以将云电脑的窗口设置为 32:9 的超宽带鱼屏。

多窗口变带鱼屏

或是让它变成一个 6m 开外的独立的巨幕。

巨幕

一系列的操作后我们发现,这种空间的沉浸感是任何现有笔记本电脑的平面显示不能比拟的,无论是媒体编辑、代码编写,都能找到最适合自己的显示组合方式,一旦拥有,欲罢不能。

空间搜索,眼神定位,语音输入,一气呵成

信息呈现的另一个重大创新是空间搜索,基于 YodaOS-Master 这一 Rokid 专门为空间计算打造的操作系统。

传统的搜索方式,结果的呈现是在网页上平铺,这种处理方式自然有其合理之处,但是在 AR 应用里,并非是最优的选择。

如何用最优雅、最高效的形式让用户在一众搜索结果中快速找到自己想要的内容?Rokid 对空间展示发起了新一轮的革命。

%E7%A9%BA%E9%97%B4%E6%90%9C%E7%B4%A2

以视频搜索为例,当我们用语音在空间中搜索想要观看的视频时,空间展示的结果并非是规规整整的卡片/列表,而是将最相关的第一层信息在眼前展开,并根据相关性依次向后排列。

我们看到的是多层信息层叠展现,平面搜索变成了空间搜索。

接下来,Misa 在台上还极力介绍了另一个神奇的功能:当目光注视到某个视频的时候,它就会自动播放;当手指或鼠标选中这个视频时,所有其他的视频信息卡片则会自动更新。

空间搜索

以此,Misa 断言,它将是未来 AR 时代默认的信息展示方式,将改变未来直播、搜索、推荐、短视频等各种在线信息的呈现形式。

而 Rokid 正是那个为未来信息打造全新呈现和展现方式样板的引领者。

目前,微软的 Bing 搜索引擎、华为的 HMS 都已经完成了对这种呈现结果的支持,同时 B 站的视频搜索、淘宝的商品搜索也正在接入。

做全球 OST 的引领者,不屑于窝里横

目前,AR 透视方案主要分成了两个技术流派,即 VST 和 OST。

VST,即 Video See Through 视频透视,简而言之,是通过摄像头获取外界信息,传递给设备,设备处理后在显示器内进行画面重构。苹果、Pico、Quest 等厂商是 VST 的拥簇。

Vision_Pro_interface

△ 苹果 Vision Pro

而 OST,全称 Optical See Through,即光学透视。通过摄像头捕捉外界信息,再和虚拟的信息结合,最终呈现出虚实叠加的画面。Google、Hololens 以及 Magic Leap 是其代表。

KXtBM96N5pz14ZlCj4 (1)

△ Magic Leap Helio 应用,图源:Next Reality

两种方案各有优劣,VST 对于硬件的要求很高,也就导致其成本普遍偏高。而且其头盔形态相对笨重,如何平衡用户长时间佩戴时的不适感是个不得不去关注的难题。但与此同时,其沉浸感更强。同时由于它产生的都是数字化内容,空间坐标更容易对齐,并且色彩还原度也做得更好。

而 OST 对应的设备基本为眼镜形态,这对于产品力的把控就提出了更高的要求。而且由于需要实时将物理世界和虚拟信息融合,对于光路设计、算法都有不小的考验。但是与此同时,OST 方案对于真实世界的融合度也更高。

VST_vs_OST

这样一来,将 Rokid AR Studio 定义为消费级 OST 个人空间计算平台,就合情合理了。

苹果向左,Rokid 向右

Rokid Max Pro 搭载了索尼的 Micro OLED 显示屏,单眼显示分辨率为 1920x1200,最高刷新率达 120Hz,入眼亮度为 500尼特,提供了约 6m 处观看 215 寸大屏的极致视觉享受。

215_screen

而作为算力中心的 Rokid Station Pro 搭载了高通最新的骁龙 XR2+ Gen1 平台,配备了 12G RAM + 128G ROM,同时支持 WiFi6/6E,而机身内置的 7620mAh 电池支持重度使用约 6 小时。考虑到有不少使用场景需要佩戴手套,Rokid Station Pro 搭载了全实体按键。

xr2+

Rokid 的产品路线与苹果截然不同。

苹果是把 AR 的想法装进 MR 的壳子里,Vision Pro 从本质上来说还是一个 MR 头盔。

而 Rokid 则坚定地认为,空间计算的硬件载体形态应该是更轻易和易于佩戴的 AR 眼镜,而非笨重的头盔。

差旅办公

坚持轻便佩戴的原则,Rokid 严格控制眼镜的重量。Misa 说,如果每次更新致使产品重量增加 0.2 克或以上,那么产品团队就必须向 Misa 报备。出于对舒适性的考虑,未来 Rokid 还有意将 Max 和 Station 之间的连接线「剪」掉!

客观地说,Rokid AR Studio 也有很多局限,4999 + 3999 的价格,尽管是为了「让供应链也有生存空间」,但定位「消费级 OST 个人空间计算平台」对于真正的消费者还是略显勉强。

在会后交流中,Misa 说只能给 Rokid AR Studio 打 60 分。因为 Rokid 虽然「走在行业最前面」,但要让所有人为之喝彩还是不现实。

Rokid AR Studio 虽然说是定位消费级,但更多的还是展示能力,为 AR 做样板。

接下来 Rokid 还将和开发者一起,用心打磨核心场景,让 Rokid AR Studio 成为能够「always standby」的产品。

Rokid Jungle 2023 新品发布会

至于商业战略,Rokid 并不准备做追随者,Rokid 想做引领者。之于苹果,不过是「苹果向左,Rokid 向右」的两个方向。

Misa 说,Rokid 起源于十年前在 Google Glass 发布时埋下的创业种子。

从 AI 到 AR,从 Air 到 Station 到 Max 再到今天的 Pro,很多人说 Rokid 每一次都能踩点到位,这背后是十年磨一剑的笃定与自信,而不是投机。

今天 Rokid 要站到引领全球 AR 的高度,则更需要实力。


主笔:周森、陈述 / 深圳湾

编辑:陈述 / 深圳湾

>>
Back to top btn