赋之李光东：跨越家庭多模态的「体验死亡线」，告别机器人回家「吃灰」

Uploads%2farticles%2f16846%2fdsc 6696 opq4601864957

活动报道 |

2 小时前

赋之李光东：跨越家庭多模态的「体验死亡线」，告别机器人回家「吃灰」

让家庭机器人告别回家吃灰的关键在于找到高频/核心的使用场景，并让用户能真正用起来。

周森森

实验室或大模型提示词（Prompt）里运转完美的机器人，一旦进入真实的家庭场景就会瞬间「现出原形」。

真实的家庭环境是毫无章法且充满噪音的——宠物的突发叫声、电视背景音、小孩的无序插话以及死角的弱网。在这样的复杂物理世界中，用户根本不关心厂商堆叠了多少模型参数，他们有一套最直白的算账方式：「你这响应还不如我两百块的智能音箱快」。

为了跨越这条家庭机器人的「体验死亡线」，李光东提出了赋之科技的三大探索方向：首先，基础交互体验必须过线，奉行「先让用户说得出口、等得起，再谈复杂智能」的原则，联手声网 RTC 从 Agent 框架、模型训练到交互节奏进行全链路毫秒级提速。其次，用户使用高频和核心功能要靠谱，意图的理解和任务执行要稳定，用户的模糊口语指令（如「提醒奶奶去取快递」），机器人的要能理解，能拆解，能根据过程状态自己动态决策。机器人必须能够深刻理解物理世界，将用户模糊的口语指令（如「给我拍张全身照」）通过产品侧的「引导式交互」，转化为包含构图、距离、角度在内的具体可执行动作，而非干瘪地回答一句「我明白了」。最后，要通过工程化手段融合弱人脸、空间感知和长期记忆，让机器人具备连续性和趣味性。

产品经理和研发团队必须跨越单纯的「技术实现」目标，去攻克高频、长期的交互瓶颈，将冷冰冰的硬件打包成一个有温度的家庭成员，真正像一个「活的人类伙伴」一样存在，用户才愿意为其提供长期付费的粘性价值。

「家庭场景从不按提示词运行。在家里，慢会被无限放大成笨与不可用。」

「先让用户‘说得出口、等得起’，再谈更复杂的智能。」

以下是李光东在 5 月 16 日的 RTE 机器人论坛上的分享实录精华：

李光东 赋之科技 Enabot 产品负责人

演讲主题：《Enabot 家庭机器人：让多模态走进家庭》

深圳湾：当家庭机器人面对高频的用户打断或者极其碎片化的连续对话时，系统该如何避免大模型由于上下文拉长而导致的「胡言乱语」或「响应断崖式变慢」？

李光东：这也是家庭交互中最折磨产品经理的场景。我们目前的核心技术探索是把「空间—身份—记忆」当作一项长期的工程化系统能力，而不是单次对话的技巧。通过在端侧感知层进行身份线索融合，结合云端轻量化的上下文裁剪算法，配合传输链路上对交互节奏的动态调配，从而在根源上确保机器人能记住「之前聊过什么」，同时维持极高的响应敏捷度。

深圳湾：让家庭机器人不变成「吃灰」的玩具的关键在于什么？

李光东：关键在于找到高频/核心的使用场景，并让用户能真正用起来。机器人如果每天都在重复昨天的机械对话，必然会被淘汰。针对不同的人群，比如，老人需要的是简单可靠的安全看护、无感的被动关怀，而小孩则需要无门槛、强反馈的互动。我们通过端侧检测算法和远端大脑的结合，让机器人能自动识别当前交互对象的身份，可以根据视觉和声音的多模态信息和记忆做出不同反馈和互动，遇到危险也可以及时通知，在高频和核心功能场景让用户用起来，愿意持续使用。

更多本场活动精华内容，请访问：