Uploads%2farticles%2f16802%2fimage3 w1920

2026-04-10

前 OPPO 离职创业不碰硬件，却做了一个比 Google Lens 更懂「看世界」的大脑

AI 会回答问题，但很少 AI 会和你一起看世界。而 Chance AI 想成为连接「看见」与「理解」的那座桥梁。

3 月底的香港，正值一年中最浓郁的艺术季。随着巴塞尔艺术展与艺术三月的联动，全球的艺术家与藏家悉数汇集于此。

在维多利亚港的海风中，当成千上万件当代艺术品交织在中环海滨的各大展馆，我和很多普通观众一样，在享受艺术盛宴的同时，轻松就陷入了「视觉过载」的困境 ——我们能看到巴斯奇亚标志性的狂乱线条，或者是那些极具冲击力的非标准曲面装置，但除了感叹「好看」或「怪异」之外，我们很难在第一时间捕捉到作品背后的深层意义。

现场看展的痛点真实且普遍，随便罗列几条读者都会有共鸣：展品繁多，根本没时间提前做足每一件作品的攻略；面对偶然遇见、令心扉震颤的作品，即便打开手机求助于主流 GPT，获得的信息也往往停留在「这是一幅现代风格绘画」的浅层描述，要想获得作品跨越时空的叙事，则依赖于多轮对话将作者和画作等信息精准输入。更何况，并不是每一幅画作旁边都贴着二维码解说……

直到我在 Art Central 提供的工具清单里找到了解决方案。本次活动，香港亚洲当代艺术博览会官方首次与新创公司 Chance AI 合作，让与会者可以通过手机摄像头解锁每一件艺术品的意义。

Chance AI 是谁？它有何奇妙之处？

在一场名为《Seeing the Unseen》的特别交流活动中，创始人曾熙博士为我们讲述了 Chance AI 是如何成为连接「看见」与「理解」的那座桥梁。

△ 曾熙，Chance AI 创始人兼 CEO。

01

Q：为什么当下的交互是错位的？

A：对人类来讲，视觉才是最直觉的操作系统，而不是输入框。

这种对「意义」的敏锐捕捉，与曾熙博士的背景息息相关。早年间，他在 University of Barcelona 获得了博士学位，研究方向落在认知科学与当代艺术的交汇点 —— 即人类究竟是如何通过视觉去理解世界，并在此基础上形成判断与意义。

后来，他进入字节跳动的 Flow 部门担任产品与设计高级总监，亲历了豆包从 0 到 1 的构建。豆包的成功代表了当下 AI 产品的典型逻辑：以语言对话为核心入口。

这段经历让他意识到了一个结构性的缺位：巨头们都在 LLM 的战场上激战，AI 已经变得非常擅长「说」和「回答问题」，但在人类如何基于视觉直觉去理解现实世界、捕捉事物「意义」这一环，依然存在巨大的交互断层 ——AI 会回答问题，但 AI 很少会和你一起看世界。

曾熙的学术研究告诉他，生物大脑的进化，最初并不是为了思考，而是为了处理复杂的视觉信号。从 5 亿年前的三叶虫依靠视觉系统在海洋中生存，到如今人类大脑约 70% 的算力仍都消耗在视觉皮层，视觉始终是生物识别环境、判断危险与机会的第一本能。

但当下的情况却是，大脑大部分算力在处理视觉，但 AI 还停留在语言。曾熙指出，当下主流 AI 强迫用户在输入框里精准表达意图，这本质上违背了人类「先看到、再理解」的本能路径。

基于此，在 Chance AI 的逻辑里，交互不应该从复杂的 Prompt 开始，而应该回归感知。从 Prompt 到 Perception，从提示词转向感知，当下的技术演进正处于这样一个关键节点。

对人类来讲，视觉才是最直觉的操作系统，而不是输入框。

这种交互维度的某种「降级」，让 Chance AI 能跳出像素级图像识别的比拼怪圈，转而致力于建立一层模拟人类视觉通路的「解释层」。

当 AI 真正具备了这种「看」的能力，它就不再只是一个冷冰冰的回答工具，而是开始参与到人类观察与判断世界的全过程。

02

Q：为什么 Seeing the Unseen 的价值更大？

A：事物的价值事实上是由它的意义层决定的。

在感知之后，真正能触动人类灵魂的，是那层被隐藏在视觉背后的「意义」。曾熙认为，下一代 AI 正在从单纯的像素识别，跨越到深层的意义重构。

当我们将手机镜头对准一件艺术品或一栋建筑时，这种从「描述」到「推理」的进化变得清晰可见。

以中环地标 The Henderson 大楼为例，主流 AI 往往只能客观地告诉你这是一栋「现代玻璃建筑」。但在 Chance AI 的视野里，它是一朵「含苞待放的紫荆花」，是扎哈・哈迪德的设计遗产，是全球首栋非标准曲面玻璃建筑，每一块玻璃都经过精准计算以模拟花蕊的曲面。

△ Chance AI 对 The Henderson 大楼的解释（下） vs ChatGPT 和 Google Lens 的解释（上）

相比传统视觉 AI 工具，为什么 Chance AI 能看到这些「看不见」的故事？曾熙在现场提出了一个带有哲学慎思的意义公式：

意义 = 事实（Perception） × [知识（Knowledge） + 共识（Connection）]

再用这个公式解释我们看到和看不到的 The Henderson 大楼：

事实（Perception）：它是紫荆花，是曲面玻璃。
知识（Knowledge）：它是扎哈的设计语言，是非标准曲面的计算逻辑。
共识（Connection）：它是中环的地标，是香港精神的视觉符号。

在曾熙看来，一件事物的价值，并不取决于它被如何命名，而取决于被如何理解。费曼曾说「你也许能说出这只鸟在各种语言里的名字，但这并不代表你了解它；你只是知道它叫什么名字，而不是知道它是什么。」意义的构成虽建立在物理事实之上，但只有叠加了上下文的「知识」与社会文化的「共识」，才能产生真正的价值。

这也正如印了 Supreme 标号的白 T 恤比普通款贵出 15 倍，其差价并不在原料，而在于那层由街头文化和社交信号构成的意义。这个叠加的意义层才是其价值的体现。

那么，既然视觉 AI 能力并非独家秘密，为什么像 Google 这样的大平台没有去做这件事？为什么 Chance AI 能够做的比 Google Lens 做的更好？

曾熙显然有备而来，他在采访中回答道：大厂并不是没有能力，而是没有动机。Google Lens 等产品的商业底层逻辑是卖货，这导致它们的功能必然向引导消费倾斜。

而让 AI 陪你看穿搭、看皮肤、看手相、看色彩、看菜单，甚至是进行「毒舌」锐评 —— 这些 Chance AI 所内置的 Agent 商店里的诸多能力，与大厂现有的商业模式是违背的。在大厂看来，帮你看穿搭或算命并不能直接带来广告收益，甚至显得有些「不务正业」。

我们不是在做一个更好的工具，而是在改变理解世界的方式。

这恰恰为 Chance AI 留出了一个大厂的真空地带。当巨头们忙着把摄像头变成收银机时，Chance AI 正钻进一个由年轻人定义的新兴大市场，成为用户生活中那位博学且充满温情的「视觉大脑」—— 它不仅在翻译像素，更在翻译生活本身。

03

Q：为什么年轻一代不再热衷于提问？

A：年轻人不是在用 AI 寻找答案，而是在用 AI 重新看世界。

让曾熙感到兴奋的，是他在这一届年轻人身上看到的某种认知上的「基因突变」。

团队在调研中发现了一个有趣的现象：对于成长在 Instagram 和 TikTok 时代的 Z 世代来说，输入框正变得越来越「不直觉」，他们更习惯于直接用眼睛去丈量现实。曾熙称这一代年轻人是「视觉原住民」。

Young Generation（年轻一代） = Visual Native（视觉原生）

这种行为模式的转变，在 Chance AI 的全球增长数据中得到了有力佐证。截至目前，Chance AI 的全球年轻用户已突破 20 万，不仅在 iOS 欧美多个国家的下载榜挺进 Top 3，更两度斩获 Product Hunt 的当日最佳产品（Product of the Day）。

而支撑这份热度的，是其在多模态评测基准 MMMU-Pro 中拿下的 86.07 高分 —— 这个成绩不仅碾压了 GPT-5.4 和 Gemini 3 Pro 等大厂模型，甚至在视觉推理任务上首次超越了人类的平均水平。

%E4%B8%96%E7%95%8C%E7%AC%AC%E4%B8%80%E7%9A%84%E8%A7%86%E8%A7%89%E6%8E%A8%E7%90%86%E8%83%BD%E5%8A%9B1

Chance AI 的用户验证过程还伴随着一场发生在北美六所高校里的「好奇心革命」。伴随着对于「好奇心不是奢侈品，它是理解世界的起点」这一理念的认同，在纽约大学、南加大、斯坦福的校园里，学生们不再把 AI 当作完成作业的「作弊」工具，而是把它当作感知生活的「外挂大脑」。

看穿搭：不搜价格，搜这身 OOTD 里的审美流派。
看皮肤：不买药膏，先让 AI 监测肤质并给出护肤决策。
看菜单：不查单词，让 AI 结合过敏史推荐最值得试的那道菜。

Chance_AI_%E5%B7%B2%E7%BB%8F%E5%9C%A8%E6%B5%B7%E5%A4%96%E5%B9%B4%E8%BD%BB%E4%BA%BA%E4%B8%AD%E6%B5%81%E8%A1%8C2

Chance_AI_%E5%B7%B2%E7%BB%8F%E5%9C%A8%E6%B5%B7%E5%A4%96%E5%B9%B4%E8%BD%BB%E4%BA%BA%E4%B8%AD%E6%B5%81%E8%A1%8C1

理解不是终点，理解会形成判断，而判断最终成为品味。

这种从「获取信息」到「构建理解」的转变，正在潜移默化地塑造着年轻人的审美边界。

更深层的意义在于，这种交互方式正在将年轻人从算法推荐的「信息茧房」中解救出来。在高度自动化的数字世界里，人们的日常经验往往是可预测且重复的，而 Chance AI 试图通过视觉这个入口，重新放大生活中的「偶然性」。

当学生们走在校园里，随手拍下一栋老建筑的历史、路边一朵不知名的花，或是朋友包上挂的一只潮玩时，他们是在主动探索，而非被动接受。

这种不期而遇的启发，也正是 Chance AI 产品名字的由来。

04

Q：为什么不急着做 AI 硬件？

A：数据的单纯采集已不是难点，如何将图像转化为「有意义的洞察」才是真正的护城河。

在交流会的尾声，我们的话题不可避免地转向了硬件。

考虑到曾熙及其核心团队深厚的消费电子背景 —— 成员多来自 OnePlus、OPPO 等一线大厂，甚至项目经理曾是硬件工程的负责人，曾亲历过智能硬件从蛮荒增长到红海竞争的完整周期。按理说，做硬件应该是他们的舒适区，外界始终在期待 Chance AI 会掏出一副眼镜或是一个挂饰。

做硬件我们不需要努力，需要的是克制。

曾熙指着手机 App 界面上的列表向我解释道，今天看到的每一个 Visual Agent，拆出来都有可能是一个单独的硬件。如果切入穿搭场景，它的形态可能是智能穿衣镜；如果看皮肤，它可能是 AI 化妆镜；甚至在澳网现场，它可以是帮人看运势的交互终端。

Media_Tour_%E6%B4%BB%E5%8A%A8%E7%8E%B0%E5%9C%BA4_w1920

%E6%99%BA%E8%83%BD%E4%BD%93%E5%95%86%E5%BA%97

△ Chance AI 的视觉智能体商店

事实上，这种基于视觉 Agent 的授权合作正在发生，包括这一次和香港亚洲当代艺术博览会合作，以及与其他 B 端业务的洽谈，Chance AI 正在将大量沉睡的数据转化为可感知的体验。

数据的单纯采集已不是难点，如何将图像转化为「有意义的洞察」才是真正的护城河。

尽管曾熙为我们描绘了一幅 Hardware Portal 的蓝图，但透着一种极其清醒的克制，他将 Chance AI 定位为一个通用的视觉智能大脑，在持续的进化中静候着硬件环境的成熟。

切 AI 入口赛道，硬件切只能切「垂」，软件切能切「宽」。我感觉我们从软件切这条路是对的。

这种「先大脑、后容器」优先的逻辑，让 Chance AI 能够以「Agent OS」为底座，支撑起未来更广阔的硬件生态，而非将自己锁死在某一个特定的终端里。

Chance_AI_%E6%98%AF_Art_Central_%E5%AE%98%E6%96%B9_AI_%E4%BC%99%E4%BC%B41

除了站位之外，曾熙的克制还来自于对行业竞争维度的深刻思考。

以风靡全球的 Plaud 录音卡为例，他认为，其真正的对手不是其他硬件厂商，而是像 Notion 这样的软件生态。而 Oura 的成功也在于其服务的订阅价值而非硬件本身。

当下视觉 AI 的硬件虽然层出不穷，但大多只是在传统设备上生硬地「外挂」一个 AI 功能，视觉交互体验依然支离破碎。摄像头已经能拍清万物，但看完之后如何思考、如何转化成有用的决策、如何变成下一步行动，这颗有洞察力的「视觉大脑」在行业里依然是空白的。

此外，对供应链与硬件生产管理复杂度的敬畏，也让曾熙对做硬件持谨慎态度。「我们静候行业带来一次革命，无论是供应链的突破，还是渠道的更迭。」在 AI 硬件真正的拐点出现之前，他选择先将这颗「大脑」在软件的沃土里喂养壮大。

Chance_AI_%E6%98%AF_Art_Central_%E5%AE%98%E6%96%B9_AI_%E4%BC%99%E4%BC%B42

最后，作为本文的小结，香港中环的这一场「视觉」盛宴让我们真正体会到了 AI 正在经历从「说」到「看」的跨越，视觉不仅是今天最被低估的入口，更是一切好奇心的原点。当 AI 终于学会了像人类一样去「看世界」，那场关于交互范式的变革才算真正开始了倒计时。

而 Chance AI 已经站在了起跑线上，等着带你去看那些「看不见的意义」。

主笔：周森

审校：小炫

编辑：陈述

ChanceAI

AI视觉

大模型

ArtCentral

艺术展

深圳湾（微信公众号 ID：shenzhenware）是最早也是最活跃的硬件创新社区和媒体，关注「软件+硬件」带来的场景和交互创新，以及与平台和应用相连的产业链升级。

版权声明：本文系深圳湾原创，转载或摘录请先获得授权。
深圳湾微信公众号：shenzhenware。深圳湾同时在头条号、企鹅号、知乎等主流媒体站开设专栏板块，欢迎关注。转载、约稿、投稿、团队报道请在公众号对话框回复关键字并留下联系方式。

上一篇：从拍学机的混战中，拆出一个认知相机新物种

下一篇：美的把全屋智能门槛打到 2999 元，这波「懒人经济」你跟吗？