吉利杨硕：车里踩过的坑，都是机器人走向现实的指路牌

Uploads%2farticles%2f16845%2fdsc 6595 opq4601801729

活动报道 |

2 小时前

吉利杨硕：车里踩过的坑，都是机器人走向现实的指路牌

当车载语音助手不再局限于导航和音乐控制，它还能做什么？

周森森

传统车载语音助手的体验往往是割裂的——上车唤醒、下车断联。但在杨硕看来，未来的智能体应该跟随用户，在不同设备间无缝迁移。用户在家里通过智能音箱设置的导航目的地，上车后应该自动同步；车内没听完的播客，下车后应该能在手机上继续播放。

实现这一体验的前提，是底层语音交互能力的打通和多设备间的上下文共享。杨硕在论坛上详细拆解了吉利在这方面的技术布局。

以下是杨硕在 5 月 16 日的 RTE 机器人论坛上的分享实录精华：

杨硕 吉利汽车研究院人工智能中心全域 AI 业务负责人

演讲主题：《人-车-家全场景智能化构建：当超级 Eva 遇见贾维斯》

作为本次论坛最先跨入 PhysicalAI 规模化落地的先行者，杨硕从一个超越传统汽车行业的视角切入，指出汽车并不单纯是一个出行工具，其本身就是一个移动的、具备极高复杂度的大型智能机器人。在吉利全域 AI2.0 的战略布局中，汽车已被重新定义为数据中枢、算力中心与交互枢纽的三位一体。

但杨硕敏锐地观察到，当前的行业痛点在于智能家居、车载系统和智能穿戴依旧各自为战，导致用户意图在设备切换时发生严重断裂，体验极度碎片化。为此，吉利正在做的事情是打破设备之间的物理边界，构建一个由「人、车、家、眼镜、机器人」共同组成的泛在 AI 空间网络。

他强调，未来的核心演进趋势必然是从「单设备助手」升级为「跨设备智能体」。作为物理世界中最早期、规模最大且电力与算力储备最充沛的 AI 落地场景，智能座舱（如吉利量产的超级 Eva）已经提前在强噪声、弱网环境、多人同时交互等技术泥潭里「踩过了很多的坑」。

在具体的攻坚过程中，车企已提前攻克了诸如 120 码高速行驶等极端强噪声环境下的近场与远场语音识别、多人同时在场交互的干扰、主副驾音区隔离、弱网乃至无网环境下的端侧保障等核心痛点。这些在极端出行场景下提炼出的底层工程能力、场景闭环逻辑以及数据飞轮机制，不仅能让汽车成为人-车-家的交互中枢，更应当作为一种「老大哥」的经验，全面向居家机器人、AI 眼镜等 PhysicalAI 硬件迁移，从而完成「感知-决策-执行」的完整生态闭环。

「未来的 AIAgent 绝不是单设备助理，而是跨设备的智能体。」

「汽车是 AI 最早进入 PhysicalAI 的演练场，我们在座舱强噪声和弱网里踩过的坑，就是机器人走向家庭的指路牌。」

深圳湾：车载语音交互踩过的最深的坑是什么？对今天的家庭机器人有什么可以规避的启示？

杨硕：车载语音早期最痛苦的是「误唤醒」和「伪智能」，过分追求了「功能堆砌」和「听懂指令」。一来，在高速行驶或车内多人聊天时，系统频繁被噪音错误激活；二来，交互冷冰冰，系统只能机械地执行命令而无法理解人类的真实意图。对家庭机器人的启示在于，不能只做「听话」的机器，必须建立极强的空间感知和场景上下文理解能力，优先解决在复杂物理环境下的「抗干扰能力」和「打断机制」，知道什么时候该闭嘴，什么时候该主动提供帮助，让交互更自然。

深圳湾：汽车是算力与电力大户，但对于体积和资源远不及汽车的移动机器人硬件，车企沉淀的工程经验该如何低成本地落地和复用？

杨硕：车能承担超级接口的意图层决策，而机器人的定位应当是物理代理（PhysicalAgent）。虽然机器人硬件体积受限，但通过声网等 RTC 技术的融合打通，它可以共享车载智能座舱或云端大模型（端云协同）的复杂决策结果。整机厂需要做的是将车端的多模态交互矩阵进行轻量化剪裁，优先保障最基础的交互连续性。

更多本场活动精华内容，请访问：