圆桌对话:PhysicalAI 距离大规模落地还有多远?
吉利杨硕:车里踩过的坑,都是机器人走向现实的指路牌
当车载语音助手不再局限于导航和音乐控制,它还能做什么?
传统车载语音助手的体验往往是割裂的——上车唤醒、下车断联。但在杨硕看来,未来的智能体应该跟随用户,在不同设备间无缝迁移。用户在家里通过智能音箱设置的导航目的地,上车后应该自动同步;车内没听完的播客,下车后应该能在手机上继续播放。
实现这一体验的前提,是底层语音交互能力的打通和多设备间的上下文共享。杨硕在论坛上详细拆解了吉利在这方面的技术布局。
以下是杨硕在 5 月 16 日的 RTE 机器人论坛上的分享实录精华:
杨硕 吉利汽车研究院人工智能中心全域 AI 业务负责人
演讲主题:《人-车-家全场景智能化构建:当超级 Eva 遇见贾维斯》
作为本次论坛最先跨入 PhysicalAI 规模化落地的先行者,杨硕从一个超越传统汽车行业的视角切入,指出汽车并不单纯是一个出行工具,其本身就是一个移动的、具备极高复杂度的大型智能机器人。在吉利全域 AI2.0 的战略布局中,汽车已被重新定义为数据中枢、算力中心与交互枢纽的三位一体。
但杨硕敏锐地观察到,当前的行业痛点在于智能家居、车载系统和智能穿戴依旧各自为战,导致用户意图在设备切换时发生严重断裂,体验极度碎片化。为此,吉利正在做的事情是打破设备之间的物理边界,构建一个由「人、车、家、眼镜、机器人」共同组成的泛在 AI 空间网络。
他强调,未来的核心演进趋势必然是从「单设备助手」升级为「跨设备智能体」。作为物理世界中最早期、规模最大且电力与算力储备最充沛的 AI 落地场景,智能座舱(如吉利量产的超级 Eva)已经提前在强噪声、弱网环境、多人同时交互等技术泥潭里「踩过了很多的坑」。
在具体的攻坚过程中,车企已提前攻克了诸如 120 码高速行驶等极端强噪声环境下的近场与远场语音识别、多人同时在场交互的干扰、主副驾音区隔离、弱网乃至无网环境下的端侧保障等核心痛点。这些在极端出行场景下提炼出的底层工程能力、场景闭环逻辑以及数据飞轮机制,不仅能让汽车成为人-车-家的交互中枢,更应当作为一种「老大哥」的经验,全面向居家机器人、AI 眼镜等 PhysicalAI 硬件迁移,从而完成「感知-决策-执行」的完整生态闭环。
「未来的 AIAgent 绝不是单设备助理,而是跨设备的智能体。」
「汽车是 AI 最早进入 PhysicalAI 的演练场,我们在座舱强噪声和弱网里踩过的坑,就是机器人走向家庭的指路牌。」
深圳湾:车载语音交互踩过的最深的坑是什么?对今天的家庭机器人有什么可以规避的启示?
杨硕:车载语音早期最痛苦的是「误唤醒」和「伪智能」,过分追求了「功能堆砌」和「听懂指令」。一来,在高速行驶或车内多人聊天时,系统频繁被噪音错误激活;二来,交互冷冰冰,系统只能机械地执行命令而无法理解人类的真实意图。对家庭机器人的启示在于,不能只做「听话」的机器,必须建立极强的空间感知和场景上下文理解能力,优先解决在复杂物理环境下的「抗干扰能力」和「打断机制」,知道什么时候该闭嘴,什么时候该主动提供帮助,让交互更自然。
深圳湾:汽车是算力与电力大户,但对于体积和资源远不及汽车的移动机器人硬件,车企沉淀的工程经验该如何低成本地落地和复用?
杨硕:车能承担超级接口的意图层决策,而机器人的定位应当是物理代理(PhysicalAgent)。虽然机器人硬件体积受限,但通过声网等 RTC 技术的融合打通,它可以共享车载智能座舱或云端大模型(端云协同)的复杂决策结果。整机厂需要做的是将车端的多模态交互矩阵进行轻量化剪裁,优先保障最基础的交互连续性。
更多本场活动精华内容,请访问:
- 赋之科技 李光东:跨越家庭多模态的「体验死亡线」,告别机器人回家「吃灰」【详情:李光东篇】
- 声网 姚光华:模型决定聪明的上限,交互节奏决定是不是「活的存在」【详情:姚光华篇】
- 阶跃星辰 赵皓天:物理世界的机器人需要空间智能【详情:赵皓天篇】
- 瑞芯微 王鹏程:敏感数据不出端侧,是 PhysicalAI 建立用户信任的终极底线【详情:王鹏程篇】
- 圆桌对话:PhysicalAI 距离大规模落地还有多远?【详情:圆桌篇】
- 活动万字长文总结【详情:活动回顾全文】
主笔:周森
审校:小炫
编辑:陈述
