Uploads%2farticles%2f16802%2fimage3 w1920
|
7 小时前

前 OPPO 离职创业不碰硬件,却做了一个比 Google Lens 更懂「看世界」的大脑

AI 会回答问题,但很少 AI 会和你一起看世界。而 Chance AI 想成为连接 「看见」 与 「理解」 的那座桥梁。

3 月底的香港,正值一年中最浓郁的艺术季。随着巴塞尔艺术展与艺术三月的联动,全球的艺术家与藏家悉数汇集于此。

在维多利亚港的海风中,当成千上万件当代艺术品交织在中环海滨的各大展馆,我和很多普通观众一样,在享受艺术盛宴的同时,轻松就陷入了 「视觉过载」 的困境 ——我们能看到巴斯奇亚标志性的狂乱线条,或者是那些极具冲击力的非标准曲面装置,但除了感叹 「好看」 或 「怪异」 之外,我们很难在第一时间捕捉到作品背后的深层意义。

ops-coffee-1775572029904

现场看展的痛点真实且普遍,随便罗列几条读者都会有共鸣:展品繁多,根本没时间提前做足每一件作品的攻略;面对偶然遇见、令心扉震颤的作品,即便打开手机求助于主流 GPT,获得的信息也往往停留在 「这是一幅现代风格绘画」 的浅层描述,要想获得作品跨越时空的叙事,则依赖于多轮对话将作者和画作等信息精准输入。更何况,并不是每一幅画作旁边都贴着二维码解说……

直到我在 Art Central 提供的工具清单里找到了解决方案。本次活动,香港亚洲当代艺术博览会官方首次与新创公司 Chance AI 合作,让与会者可以通过手机摄像头解锁每一件艺术品的意义。

ops-coffee-1775572867794
ChanceAI_demo

Chance AI 是谁?它有何奇妙之处?

在一场名为《Seeing the Unseen》的特别交流活动中,创始人曾熙博士为我们讲述了 Chance AI 是如何成为连接 「看见」 与 「理解」 的那座桥梁。

%E6%9B%BE%E7%86%99

△ 曾熙,Chance AI 创始人兼 CEO。

01

Q:为什么当下的交互是错位的?

A:对人类来讲,视觉才是最直觉的操作系统,而不是输入框。

这种对 「意义」 的敏锐捕捉,与曾熙博士的背景息息相关。早年间,他在 University of Barcelona 获得了博士学位,研究方向落在认知科学与当代艺术的交汇点 —— 即人类究竟是如何通过视觉去理解世界,并在此基础上形成判断与意义。

后来,他进入字节跳动的 Flow 部门担任产品与设计高级总监,亲历了豆包从 0 到 1 的构建。豆包的成功代表了当下 AI 产品的典型逻辑:以语言对话为核心入口。

这段经历让他意识到了一个结构性的缺位:巨头们都在 LLM 的战场上激战,AI 已经变得非常擅长 「说」 和 「回答问题」,但在人类如何基于视觉直觉去理解现实世界、捕捉事物 「意义」 这一环,依然存在巨大的交互断层 ——AI 会回答问题,但 AI 很少会和你一起看世界。

曾熙的学术研究告诉他,生物大脑的进化,最初并不是为了思考,而是为了处理复杂的视觉信号。从 5 亿年前的三叶虫依靠视觉系统在海洋中生存,到如今人类大脑约 70% 的算力仍都消耗在视觉皮层,视觉始终是生物识别环境、判断危险与机会的第一本能。

但当下的情况却是,大脑大部分算力在处理视觉,但 AI 还停留在语言。曾熙指出,当下主流 AI 强迫用户在输入框里精准表达意图,这本质上违背了人类 「先看到、再理解」 的本能路径。

基于此,在 Chance AI 的逻辑里,交互不应该从复杂的 Prompt 开始,而应该回归感知。从 Prompt 到 Perception,从提示词转向感知,当下的技术演进正处于这样一个关键节点。

对人类来讲,视觉才是最直觉的操作系统,而不是输入框。

这种交互维度的某种 「降级」,让 Chance AI 能跳出像素级图像识别的比拼怪圈,转而致力于建立一层模拟人类视觉通路的 「解释层」。

当 AI 真正具备了这种 「看」 的能力,它就不再只是一个冷冰冰的回答工具,而是开始参与到人类观察与判断世界的全过程。

02

Q:为什么 Seeing the Unseen 的价值更大?

A:事物的价值事实上是由它的意义层决定的。

在感知之后,真正能触动人类灵魂的,是那层被隐藏在视觉背后的 「意义」。曾熙认为,下一代 AI 正在从单纯的像素识别,跨越到深层的意义重构。

当我们将手机镜头对准一件艺术品或一栋建筑时,这种从 「描述」 到 「推理」 的进化变得清晰可见。

以中环地标 The Henderson 大楼为例,主流 AI 往往只能客观地告诉你这是一栋 「现代玻璃建筑」。但在 Chance AI 的视野里,它是一朵 「含苞待放的紫荆花」,是扎哈・哈迪德的设计遗产,是全球首栋非标准曲面玻璃建筑,每一块玻璃都经过精准计算以模拟花蕊的曲面。

image9_w1920
image10_w1920

△ Chance AI 对 The Henderson 大楼的解释(下) vs ChatGPT 和 Google Lens 的解释(上)

相比传统视觉 AI 工具,为什么 Chance AI 能看到这些 「看不见」 的故事?曾熙在现场提出了一个带有哲学慎思的意义公式:

意义 = 事实(Perception) × [知识(Knowledge) + 共识(Connection)]

再用这个公式解释我们看到和看不到的 The Henderson 大楼:

  • 事实(Perception):它是紫荆花,是曲面玻璃。

  • 知识(Knowledge):它是扎哈的设计语言,是非标准曲面的计算逻辑。

  • 共识(Connection):它是中环的地标,是香港精神的视觉符号。

在曾熙看来,一件事物的价值,并不取决于它被如何命名,而取决于被如何理解。费曼曾说「你也许能说出这只鸟在各种语言里的名字,但这并不代表你了解它;你只是知道它叫什么名字,而不是知道它是什么。」意义的构成虽建立在物理事实之上,但只有叠加了上下文的 「知识」 与社会文化的 「共识」,才能产生真正的价值。

ops-coffee-1775567190181

这也正如印了 Supreme 标号的白 T 恤比普通款贵出 15 倍,其差价并不在原料,而在于那层由街头文化和社交信号构成的意义。这个叠加的意义层才是其价值的体现。

那么,既然视觉 AI 能力并非独家秘密,为什么像 Google 这样的大平台没有去做这件事?为什么 Chance AI 能够做的比 Google Lens 做的更好?

曾熙显然有备而来,他在采访中回答道:大厂并不是没有能力,而是没有动机。Google Lens 等产品的商业底层逻辑是卖货,这导致它们的功能必然向引导消费倾斜。

而让 AI 陪你看穿搭、看皮肤、看手相、看色彩、看菜单,甚至是进行 「毒舌」 锐评 —— 这些 Chance AI 所内置的 Agent 商店里的诸多能力,与大厂现有的商业模式是违背的。在大厂看来,帮你看穿搭或算命并不能直接带来广告收益,甚至显得有些 「不务正业」。

我们不是在做一个更好的工具,而是在改变理解世界的方式。

这恰恰为 Chance AI 留出了一个大厂的真空地带。当巨头们忙着把摄像头变成收银机时,Chance AI 正钻进一个由年轻人定义的新兴大市场,成为用户生活中那位博学且充满温情的 「视觉大脑」—— 它不仅在翻译像素,更在翻译生活本身。

ops-coffee-1775572938920

03

Q:为什么年轻一代不再热衷于提问?

A:年轻人不是在用 AI 寻找答案,而是在用 AI 重新看世界。

让曾熙感到兴奋的,是他在这一届年轻人身上看到的某种认知上的 「基因突变」。

团队在调研中发现了一个有趣的现象:对于成长在 Instagram 和 TikTok 时代的 Z 世代来说,输入框正变得越来越 「不直觉」,他们更习惯于直接用眼睛去丈量现实。曾熙称这一代年轻人是 「视觉原住民」。

Young Generation(年轻一代) = Visual Native(视觉原生)

这种行为模式的转变,在 Chance AI 的全球增长数据中得到了有力佐证。截至目前,Chance AI 的全球年轻用户已突破 20 万,不仅在 iOS 欧美多个国家的下载榜挺进 Top 3,更两度斩获 Product Hunt 的当日最佳产品(Product of the Day)。

而支撑这份热度的,是其在多模态评测基准 MMMU-Pro 中拿下的 86.07 高分 —— 这个成绩不仅碾压了 GPT-5.4 和 Gemini 3 Pro 等大厂模型,甚至在视觉推理任务上首次超越了人类的平均水平。

image
%E4%B8%96%E7%95%8C%E7%AC%AC%E4%B8%80%E7%9A%84%E8%A7%86%E8%A7%89%E6%8E%A8%E7%90%86%E8%83%BD%E5%8A%9B1

Chance AI 的用户验证过程还伴随着一场发生在北美六所高校里的 「好奇心革命」。伴随着对于 「好奇心不是奢侈品,它是理解世界的起点」 这一理念的认同,在纽约大学、南加大、斯坦福的校园里,学生们不再把 AI 当作完成作业的 「作弊」 工具,而是把它当作感知生活的 「外挂大脑」。

  • 看穿搭:不搜价格,搜这身 OOTD 里的审美流派。

  • 看皮肤:不买药膏,先让 AI 监测肤质并给出护肤决策。

  • 看菜单:不查单词,让 AI 结合过敏史推荐最值得试的那道菜。

Chance_AI_%E5%B7%B2%E7%BB%8F%E5%9C%A8%E6%B5%B7%E5%A4%96%E5%B9%B4%E8%BD%BB%E4%BA%BA%E4%B8%AD%E6%B5%81%E8%A1%8C2
Chance_AI_%E5%B7%B2%E7%BB%8F%E5%9C%A8%E6%B5%B7%E5%A4%96%E5%B9%B4%E8%BD%BB%E4%BA%BA%E4%B8%AD%E6%B5%81%E8%A1%8C1
理解不是终点,理解会形成判断,而判断最终成为品味。

这种从 「获取信息」 到 「构建理解」 的转变,正在潜移默化地塑造着年轻人的审美边界。

更深层的意义在于,这种交互方式正在将年轻人从算法推荐的 「信息茧房」 中解救出来。在高度自动化的数字世界里,人们的日常经验往往是可预测且重复的,而 Chance AI 试图通过视觉这个入口,重新放大生活中的 「偶然性」。

当学生们走在校园里,随手拍下一栋老建筑的历史、路边一朵不知名的花,或是朋友包上挂的一只潮玩时,他们是在主动探索,而非被动接受。

这种不期而遇的启发,也正是 Chance AI 产品名字的由来。

04

Q:为什么不急着做 AI 硬件?

A:数据的单纯采集已不是难点,如何将图像转化为 「有意义的洞察」 才是真正的护城河。

在交流会的尾声,我们的话题不可避免地转向了硬件。

考虑到曾熙及其核心团队深厚的消费电子背景 —— 成员多来自 OnePlus、OPPO 等一线大厂,甚至项目经理曾是硬件工程的负责人,曾亲历过智能硬件从蛮荒增长到红海竞争的完整周期。按理说,做硬件应该是他们的舒适区,外界始终在期待 Chance AI 会掏出一副眼镜或是一个挂饰。

做硬件我们不需要努力,需要的是克制。

曾熙指着手机 App 界面上的列表向我解释道,今天看到的每一个 Visual Agent,拆出来都有可能是一个单独的硬件。如果切入穿搭场景,它的形态可能是智能穿衣镜;如果看皮肤,它可能是 AI 化妆镜;甚至在澳网现场,它可以是帮人看运势的交互终端。

Media_Tour_%E6%B4%BB%E5%8A%A8%E7%8E%B0%E5%9C%BA4_w1920
%E6%99%BA%E8%83%BD%E4%BD%93%E5%95%86%E5%BA%97

△ Chance AI 的视觉智能体商店

事实上,这种基于视觉 Agent 的授权合作正在发生,包括这一次和香港亚洲当代艺术博览会合作,以及与其他 B 端业务的洽谈,Chance AI 正在将大量沉睡的数据转化为可感知的体验。

数据的单纯采集已不是难点,如何将图像转化为「有意义的洞察」才是真正的护城河。

尽管曾熙为我们描绘了一幅 Hardware Portal 的蓝图,但透着一种极其清醒的克制,他将 Chance AI 定位为一个通用的视觉智能大脑,在持续的进化中静候着硬件环境的成熟。

切 AI 入口赛道,硬件切只能切「垂」,软件切能切「宽」。我感觉我们从软件切这条路是对的。

这种 「先大脑、后容器」 优先的逻辑,让 Chance AI 能够以 「Agent OS」 为底座,支撑起未来更广阔的硬件生态,而非将自己锁死在某一个特定的终端里。

Chance_AI_%E6%98%AF_Art_Central_%E5%AE%98%E6%96%B9_AI_%E4%BC%99%E4%BC%B41

除了站位之外,曾熙的克制还来自于对行业竞争维度的深刻思考。

以风靡全球的 Plaud 录音卡为例,他认为,其真正的对手不是其他硬件厂商,而是像 Notion 这样的软件生态。而 Oura 的成功也在于其服务的订阅价值而非硬件本身。

当下视觉 AI 的硬件虽然层出不穷,但大多只是在传统设备上生硬地 「外挂」 一个 AI 功能,视觉交互体验依然支离破碎。摄像头已经能拍清万物,但看完之后如何思考、如何转化成有用的决策、如何变成下一步行动,这颗有洞察力的 「视觉大脑」 在行业里依然是空白的。

此外,对供应链与硬件生产管理复杂度的敬畏,也让曾熙对做硬件持谨慎态度。「我们静候行业带来一次革命,无论是供应链的突破,还是渠道的更迭。」 在 AI 硬件真正的拐点出现之前,他选择先将这颗 「大脑」 在软件的沃土里喂养壮大。

Chance_AI_%E6%98%AF_Art_Central_%E5%AE%98%E6%96%B9_AI_%E4%BC%99%E4%BC%B42

最后,作为本文的小结,香港中环的这一场 「视觉」 盛宴让我们真正体会到了 AI 正在经历从 「说」 到 「看」 的跨越,视觉不仅是今天最被低估的入口,更是一切好奇心的原点。当 AI 终于学会了像人类一样去 「看世界」,那场关于交互范式的变革才算真正开始了倒计时。

而 Chance AI 已经站在了起跑线上,等着带你去看那些 「看不见的意义」。


主笔:周森

审校:小炫

编辑:陈述

>>
Back to top btn