圆桌对话:PhysicalAI 距离大规模落地还有多远?
一文回顾声网 RTE 机器人论坛,拆解 PhysicalAI 走向现实的全链路图谱
如何给冷冰冰的模型穿上「活人感」的外衣,从芯片、声学、大模型到整机和生态,全链路实时交互,聆听吉利汽车、赋之科技、声网、阶跃星辰、瑞芯微的专家解读
过去两年,全行业都在为大模型在聊天框里展现出的惊人逻辑而兴奋;而伴随着 AI 从屏幕走向物理世界(PhysicalAI),去推开一扇车门、去抚摸客厅里的宠物、或者去接住一句日常闲聊时,现实的惨状却是:真实的场景从不按提示词运行,真实的物理世界毫无章法且充满噪音,「慢」和「卡顿」会被用户直接翻译成「笨」与「不可用」。
在 5 月 16 日举办的声网 RTE2026 深圳站活动上,我们将关于消费级机器人的讨论重心,放在了「PhysicalAI 与机器人实时交互」上。我们与来自吉利汽车研究院、赋之科技、声网、阶跃星辰、瑞芯微的技术与产品专家一起,首次完整地将芯片算力、声学前端、实时通信(RTC)、多模态模型以及整机厂放在了同一个闭环里讨论。
我们不仅要谈「技术能不能实现」,更要探讨如何攻克那些隐匿在底层、却死死卡住具身智能上限的工程细节,让机器人从「会说话的机器」,进化出像真人一样的「活人感」。
△ 上:科技产品顾问黄铭杰代表深圳湾主持了本场活动,中、下:活动现场
以下是本次论坛的核心观点速览,各嘉宾深度解读请见系列报道。
嘉宾亮点一览:
-
吉利汽车 杨硕:车里踩过的坑,都是机器人走向现实的指路牌【详情:杨硕篇】
赋之科技 李光东:跨越家庭多模态的「体验死亡线」,告别机器人回家「吃灰」【详情:李光东篇】
声网 姚光华:模型决定聪明的上限,交互节奏决定是不是「活的存在」【详情:姚光华篇】
阶跃星辰 赵皓天:物理世界的机器人需要空间智能【详情:赵皓天篇】
瑞芯微 王鹏程:敏感数据不出端侧,是 PhysicalAI 建立用户信任的终极底线【详情:王鹏程篇】
圆桌对话:PhysicalAI 距离大规模落地还有多远?【详情:圆桌篇】
- 活动万字长文总结【详情:活动回顾全文】
深圳湾简评:多模态实时交互的协同新篇章
纵观全场论坛的交锋与共识,你会发现,PhysicalAI 从实验室走向规模化量产,从来都不是某一个单点技术的独舞,而是一场端、边、云、模型、网络与硬件全链路协同的系统工程。
在最后的圆桌对话中,这种产业链上下游的协同变得尤为清晰:阶跃星辰在用端云协同去驯服大模型的算力饥饿与场景幻觉;瑞芯微在用多核异构的平台化芯片为端侧敏感数据拉起隐私的底线;声网则将过去十年服务于「人与人连接」的实时网络能力,重新定义为 PhysicalAI 时代服务于「AI 与人连接」的实时神经系统,在毫秒之间传递着情绪、呼吸感与无感打断的交互节奏。
从吉利在智能座舱里替行业提前踩过的抗噪与弱网之坑,到赋之科技为了不让机器人回家「吃灰」而死磕的长期记忆与主动关怀,这些行走在一线的探索者们,正在用最务实的态度去解最难的题。
大模型决定了 AI 的聪明上限,但唯有软硬一体的协同、超低延迟的多模态同步和声学工程的细水长流,才能真正脱掉 AI 身上那层呆板的算法外衣,赋予它在物理现实里安身立命的温度。PhysicalAI 的大规模破局或许仍有一段路要走,但在这场全产业链的并肩奔跑中,关于未来的轮廓正在被勾勒得更加清晰。
下期活动预告:声网 RTE2026 春夏巡游
声网在实时互动(RTE)技术上的每一次迭代,都在刷新我们对人机交互的认知。从让设备「能听会说」的 R1 套件,到如今全场景升级、实现「能看会动」关键跨越的 R2 全场景 AI 机器人开发套件,多模态交互的想象边界正在被不断延伸。
回望过去,由声网发起并连续举办十一届的 RTE 实时互联网大会,见证了整个行业从 RTC 实时通讯技术向 RTE 实时互动场景的爆发。今天,随着大模型与实时音视频技术的深度融合,RTE+AI 正在开启一个「人人可对话、物物可交互」的智能体新纪元。
一路探索,我们始终在寻找同一个问题的答案:在数字与物理世界的交界处,机器与人之间,究竟如何建立起真实且持续的情感连接?
为了将这种探索从会场带向产业一线,从 RTE2025 的深入探讨,到 CES2026 特别活动与 AWE2026 的现场,声网围绕 AI 陪伴新物种与多模态交互技术的讨论从未停止。

> 延伸阅读:
RTE2025 AI 硬件专场:从功能堆砌到情感陪伴,AI 硬件进入「体验为王」时代
CES2026 特别活动:AI 具身化不可挡!从指令到对话,揭秘下一代 AI 原生硬件的技术底座
如今,由声网发起并携手深圳湾共同举办的「声网 RTE2026 春夏巡游」已正式启幕。在刚刚圆满落幕的首站深圳活动中,我们集结了吉利汽车研究院、赋之科技、阶跃星辰与瑞芯微等产业先锋,直击机器人落地的端侧技术难题,深度拆解了 RTE 技术如何为具体的机器人与多模态交互方案赋能。
这不仅仅是一场技术的巡礼,更是一次产业生态的引燃。下一站,我们将带着在深圳站沉淀的思索与成果,奔赴极具数字经济与智能制造活力的城市 —— 北京。
下一站北京站正在紧密策划中,我们将继续联动更多优秀的产业生态伙伴,带来更多关于具身智能与实时互动的精彩碰撞。敬请期待!
主笔:周森
审校:小炫
编辑:陈述
