圆桌对话:PhysicalAI 距离大规模落地还有多远?
赋之李光东:跨越家庭多模态的「体验死亡线」,告别机器人回家「吃灰」
让家庭机器人告别回家吃灰的关键在于找到高频/核心的使用场景,并让用户能真正用起来。
实验室或大模型提示词(Prompt)里运转完美的机器人,一旦进入真实的家庭场景就会瞬间「现出原形」。
真实的家庭环境是毫无章法且充满噪音的——宠物的突发叫声、电视背景音、小孩的无序插话以及死角的弱网。在这样的复杂物理世界中,用户根本不关心厂商堆叠了多少模型参数,他们有一套最直白的算账方式:「你这响应还不如我两百块的智能音箱快」。
为了跨越这条家庭机器人的「体验死亡线」,李光东提出了赋之科技的三大探索方向:首先,基础交互体验必须过线,奉行「先让用户说得出口、等得起,再谈复杂智能」的原则,联手声网 RTC 从 Agent 框架、模型训练到交互节奏进行全链路毫秒级提速。其次,用户使用高频和核心功能要靠谱,意图的理解和任务执行要稳定,用户的模糊口语指令(如「提醒奶奶去取快递」),机器人的要能理解,能拆解,能根据过程状态自己动态决策。机器人必须能够深刻理解物理世界,将用户模糊的口语指令(如「给我拍张全身照」)通过产品侧的「引导式交互」,转化为包含构图、距离、角度在内的具体可执行动作,而非干瘪地回答一句「我明白了」。最后,要通过工程化手段融合弱人脸、空间感知和长期记忆,让机器人具备连续性和趣味性。
产品经理和研发团队必须跨越单纯的「技术实现」目标,去攻克高频、长期的交互瓶颈,将冷冰冰的硬件打包成一个有温度的家庭成员,真正像一个「活的人类伙伴」一样存在,用户才愿意为其提供长期付费的粘性价值。
「家庭场景从不按提示词运行。在家里,慢会被无限放大成笨与不可用。」
「先让用户‘说得出口、等得起’,再谈更复杂的智能。」
以下是李光东在 5 月 16 日的 RTE 机器人论坛上的分享实录精华:
李光东 赋之科技 Enabot 产品负责人
演讲主题:《Enabot 家庭机器人:让多模态走进家庭》
深圳湾:当家庭机器人面对高频的用户打断或者极其碎片化的连续对话时,系统该如何避免大模型由于上下文拉长而导致的「胡言乱语」或「响应断崖式变慢」?
李光东:这也是家庭交互中最折磨产品经理的场景。我们目前的核心技术探索是把「空间—身份—记忆」当作一项长期的工程化系统能力,而不是单次对话的技巧。通过在端侧感知层进行身份线索融合,结合云端轻量化的上下文裁剪算法,配合传输链路上对交互节奏的动态调配,从而在根源上确保机器人能记住「之前聊过什么」,同时维持极高的响应敏捷度。
深圳湾:让家庭机器人不变成「吃灰」的玩具的关键在于什么?
李光东:关键在于找到高频/核心的使用场景,并让用户能真正用起来。机器人如果每天都在重复昨天的机械对话,必然会被淘汰。针对不同的人群,比如,老人需要的是简单可靠的安全看护、无感的被动关怀,而小孩则需要无门槛、强反馈的互动。我们通过端侧检测算法和远端大脑的结合,让机器人能自动识别当前交互对象的身份,可以根据视觉和声音的多模态信息和记忆做出不同反馈和互动,遇到危险也可以及时通知,在高频和核心功能场景让用户用起来,愿意持续使用。
更多本场活动精华内容,请访问:
- 吉列汽车 杨硕:车里踩过的坑,都是机器人走向现实的指路牌【详情:杨硕篇】
- 声网 姚光华:模型决定聪明的上限,交互节奏决定是不是「活的存在」【详情:姚光华篇】
- 阶跃星辰 赵皓天:物理世界的机器人需要空间智能【详情:赵皓天篇】
- 瑞芯微 王鹏程:敏感数据不出端侧,是 PhysicalAI 建立用户信任的终极底线【详情:王鹏程篇】
- 圆桌对话:PhysicalAI 距离大规模落地还有多远?【详情:圆桌篇】
- 活动万字长文总结【详情:活动回顾全文】
主笔:周森
审校:小炫
编辑:陈述
