十日内 18 家企业发布了新款 AI 眼镜的消息,百镜大战战火绵延
仅重 35 克的 AR+AI 眼镜,有什么特别?又是怎么做出来的?
与 Ray-Ban Meta 不一样,它没有摄像头,甚至也不要扬声器,但是它很聪明,视觉辅助你 get 到你想要的答案。
几个月前 Maker Faire 筹备期间,我曾在柴火创客空间见到了来自 MIT 的凯登·皮尔斯(Cayden Piece) ,和他就智能眼镜、AR 和 AI 等话题,展开过一番长达数小时的夜话。
凯登是 MIT 媒体实验室的研究员、工程师和创意人员,同时也是 Auki Labs 的 Memetic 实习生,致力于构建增强人类思维、感知和沟通的系统,整合了可穿戴设备、神经技术和人工智能等技术,以增强人类体验。
他的一些创新项目包括主动搜索引擎智能眼镜(proactive search engine smart glasses)、人眼作为相机(Human Eye as a Camera)的脑机接口、针对自闭症患者的社交可穿戴设备,以及通过脑刺激增强的音乐体验。
他全天佩戴着一款看起来和普通眼镜没有什么区别的智能眼镜——Vuzix Z100,它没有摄像头、甚至也没有扬声器,但有 AR 显示,单绿的波导反射在镜片上还是比较明显的。
有趣的是,当天同席的 Seeed Studio 创始人潘昊佩戴着 Ray-Ban Meta;而我当时佩戴的则是李未可的 Meta Lens Chat AI 眼镜。
我们两个人的眼镜都是没有 AR 显示功能的 AI 眼镜,但重量却比凯登这款 AR+AI 眼镜还要重,难怪凯登摇摇头,说戴着不舒服。
△ 眼镜党的聚会!左下:潘昊佩戴的 Ray-Ban Meta,右下:凯登佩戴的 Vuzix Z100,上:炫姐姐佩戴的李未可 Meta Lens Chat AI 眼镜
我们先来了解一下 Vuzix Z100 背后的企业:
Vuzix 的前身最初创立于 1997 年,早期专注于军事研发,为战术地图和视频提供高分辨率显示解决方案,随后逐步向消费电子领域拓展。2005 年,公司更名为 Icuiti,并发布首个高分辨率显示系统,用于全球博览会及军用项目。
2010 年,公司正式采用 Vuzix 名称,并推出了其首款生产型透明增强现实眼镜 STAR 1200,这一产品标志着其在 AR 技术领域的领先地位。
△ 图源:Slash Gear
△ 图源:Techcrunch
2015 年,英特尔向 Vuzix 投资 2500 万美元,获得公司 30% 的股份。此后,Vuzix 持续在企业和消费者市场中推出创新产品,包括波导技术、光学组件及智能眼镜,其应用领域涵盖医疗、物流和远程协作等。
2023 年 AWE XR 博览会期间,Vuzix 与 TeamOpenSmartGlasses(TOSG)达成合作,在 Vuzix 智能眼镜上开发 ChatGPT AI 应用程序,实现如实时语言翻译、上下文搜索引擎、智能助手、搜索等功能。
AWE 2024 期间,Vuzix 与微型光机技术公司 Avegant 宣布合作,联合开发 AR 眼镜光学显示模组,实现更高效、轻量级、全彩显示、可批量生产,以满足 AI 加持下的 AR 眼镜的设计需要。
接下来再回到这款眼镜——Vuzix Z100,如何从开发者市场走向消费市场。
它最初在今年年初的 CES 2024 上亮相,以 35 克的重量,成为当时全球最轻的带显示屏智能眼镜。
△ 图源:官网
Vuzix Z100 采用光波导方案,单眼显示器出现在右眼上,视野为 30 度。通过蓝牙与手机相连,获得网络通讯,但没有扬声器,不能提供音频信号。
△ 图源:见水印
它内置麦克风,支持 AI 语音助手,同时通过镜腿上的触摸板也可以交互。电池预计可持续使用 48 小时,为日常佩戴提供了便捷。
年初推出 Vuzix Z100 为开发者版本,伴随着系统和应用的逐渐成熟,Vuzix 开始把这款眼镜带进消费者市场。
11 月 20 日,Vuzix Z100 官宣上市,售价为 499 美元,提供透明和有色两种配色,并支持处方镜片。
在凯登看来,Vuzix Z100 是 2024 年体验排名 TOP1 的眼镜,超过 Ray-Ban Meta,首先是因为它的佩戴轻盈、舒适。
眼镜必须首先适合全天候佩戴。有一些关键指标,如眼镜重量必须在 45 克以下,最好在 40 克以下。Ray-Ban Meta 重约 49 克,其实对大多数人来说,并不是全天都可以佩戴。
其次,人体工程学设计和重量平衡至关重要,眼镜在头部分配重量的每个地方,耳朵上承受更多的重量以及良好、高空间覆盖面积对于舒适度至关重要。
△ 左:Ray-Ban Meta,右:Vuzix Z100
从这个层面上看,类似 Vuzix Z100 的一些采用波导方案的 AR 眼镜,如 INMO Go、魅族 MYVU、雷鸟 X2 等,无论波导材料是塑料、玻璃、碳化硅、还是树脂,在重量上都能得到控制。
△ 上:INMO GO,下:魅族 MYVU
而一些要求显示效果的观影眼镜,如 XREAL、Rokid 等品牌的 AR 眼镜,虽然有更明亮、更清晰的显示效果和更大的视场,但双梁结构不仅会遮住一部分视线,而且还增加了镜框的重量,戴几个小时后会感到疼痛。
△ 上:XREAL Air 2 Pro(图源:CNET),下:Rokid AR Lite(图源:Future)
所以,经过一番讨论,我们将 Vuzix Z100 舍弃摄像头和扬声器的原因,总结为以下几点:
减轻重量与增加佩戴舒适性,Z100 仅有 35 克,甚至比普通眼镜都还要轻;
摄像头和扬声器会增加功耗,缩短续航,Z100 能持续使用 48 小时,远超其他 AR 和 AI 眼镜;
外放扬声器涉及音频隐私问题,同样,摄像头更容易侵犯隐私;
借助蓝牙连接手机或耳机,佩戴者其实有更灵活的音频输出选择。
总而言之,这种设计权衡体现了 Z100 在轻便性、续航能力和灵活性之间的平衡,也为 Z100 真正进入消费市场打下了基础。
另一个能让 Vuzix Z100 全天候佩戴的原因:叠加了 AR 的 AI 体验很有用。
Vuzix Z100 集成了基于 ChatGPT 打造的 AI 主动对话能力,再搭配 640×480 单绿色的 microLED 光波导显示屏,能够获得比语音播报更丰富的信息。
而通过麦克风拾音、单绿波导视觉输出信息,正是凯登的研究范畴,即通过主动 AI 代理(Proactive AI Agent),让智能眼镜获得更智慧的对话体验。
△ 图源:Vuzix 官网
想象一下:你深夜降落在机场,你的智能眼镜知道你有行李、自行车和酒店。你无需掏出手机、打开 app、输入问题,才能弄清楚如何到达那里,你的智能眼镜会在几秒钟内自动处理所有事情,呼叫出租汽车,并在你的视野上方显示一个导航箭头,引导你前往外面的汽车。这就是智能眼镜上的主动 AI 将带来的未来。
智能眼镜上还有另一种 AI 代理:使用 Convoscope 进行对话增强。它通过一组 AI 代理增强对话,这些代理通过倾听和实时提供有用的见解来扩展你的思维。这些主动代理无需询问即可工作,使交互变得无缝且直观。比如,QuestionAnswerer 会在您提出问题时立即提供答案,IdeaGenerator 会在您需要时建议创造性的解决方案,Definer 则可立即提供清晰的定义。
凯登在他的短视频里展示了 Vuzix Z100 的很多应用场景。
为骑行同伴导航去哈佛:
指导不会做饭的人做饭:
为初次来 MIT 校园参观的朋友做导游:
帮助人们更快地学习第二语言——与使用第二语言的人交谈时,你可以获得实时字幕,帮助你更好地倾听;你还可以获得一些实时的生僻单词的翻译,确保你不会漏掉一些关键词信息。
赢得与黑客朋友的辩论——故事是这样:
朋友在加班时拿出了一颗 90% 巧克力含量的黑巧克力,凯登劝说他不要在晚上 9:30 吃这种东西,因为会让人失眠。朋友反问:巧克力里能有多少咖啡因?
这时候,智能眼镜中问答助理就起作用了,获得问题指令、云端搜索答案、再把答案放置在我的眼前。
凯登立刻就给出了朋友想要的答案:每块巧克力含 25~50 毫克的咖啡因。顺带补了一句:你很聪明,你可以比我聪明,但我有 AI 帮忙(Me plus AI, you never win)。
使用 Convoscope 和开源智能眼镜应用程序升级您的智能,聆听你的对话、并提供叠加在你的视觉上的实时定义和见解,这就是凯登为智能眼镜开发的名为 Convoscope 的开源应用,包括 Vuzix、Inmo、Activelook 等很多智能眼镜都在用。
△ 图源:AugmentOS / GitHub
湾里简评:
当下「百镜大战」之际,无论是从硬件层面,集成各种元器件和模组,可能并不是一件技术上很难攻关的事情;还是从 AI 层面,接入 ChatGPT 或者其他大模型,也都有现成的方案。
但我们应该在一个更高的层面思考如何做智能眼镜。
从硬件层面,你有我也有的大而全的产品思维已经被验证了不适合百花齐放的当下。减少不必要的元素,突出核心功能,注重功能与形式的统一,这种 less is more 的产品设计理念不仅仅是一种美学主张,更是一种实用参考。
而对操作系统和交互界面而言,但正如凯登的观点,我们已经习惯了,在一个一个的 app 小方块里做出选择,点开它,然后做完事,再关闭它。这种交互方式在大模型时代过时了,应该被撇弃了。
取而代之的是在 API 之上的主动式 AI,能够聆听和洞察你的意图,并做出搜索和判断。你不需要告诉它你需要什么,它已经知道你想要的是什么。
主笔:周森
审校:小炫
编辑:陈述