瑞芯微王鹏程：敏感数据不出端侧，是 PhysicalAI 建立用户信任的终极底线

Uploads%2farticles%2f16849%2fdsc 6975 opq4603161896

1 小时前

AI 大模型正在从云端流向边端，未来的机器人终端竞争，本质上是算力、功耗与 Token 成本的软硬一体平衡战。

瑞芯微高级市场经理王鹏程从底层芯片视角出发，提出了 PhysicalAI 时代一个不容回避的底线：敏感数据不出端侧。他强调，隐私安全、实时响应与 Token 成本正共同推动大模型从云端向端侧回归，而芯片原厂的角色也必须从通用 AIoT SoC 进化为高泛化的端侧 AI 推理底座。

以下是王鹏程在 5 月 16 日的 RTE 机器人论坛上的分享实录精华：

王鹏程 瑞芯微高级市场经理

演讲主题：《RK 芯片赋能端侧 AI 产品与具身发展挑战》

作为产业最底层的硬件基石提供商，王鹏程在演讲中指出，AI 大模型正在经历一场轰轰烈烈的「从云端向端侧回归」的逆向运动。

由于多模态机器人涉及大量的视频、音频以及家庭或工业现场的极端敏感数据，隐私安全（Privacy）已经构成了端侧部署的第一原动力，必须做到敏感数据「不出端侧」。同时，工业控制和自然交互所要求的毫秒级响应实时性、无网弱网环境下的高可靠性，以及不可忽视的云端持续 Token 带宽成本，共同倒逼着大模型必须在终端落地。

王鹏程强调，多模态大模型（包含 ASR、TTS、视觉编码、多模态融合、3D 深度估计等）的爆发，对边缘端侧的算力、功耗和综合成本控制提出了几近极致的挑战。瑞芯微的应对战略是推动芯片原厂从传统的通用 AIoTSoC，全面向端侧 AI 推理平台演进。

目前，机器人硬件终端正在快速复制 AIPC 的演进路径，形成由「主控 + 协处理器（如 RK3588/RK3576 系列大算力 NPU 平台）」构成的异构算力系统架构。通过这种底层软硬协同优化，并全面支持标准 MCP 协议与轻量级 Agent 框架，彻底降低多模态大模型在终端产品的部署门槛，以极高的性价比让高阶智能走向现实。

「敏感数据不出端侧，是 PhysicalAI 建立用户信任的终极底线。」

「AI 大模型正在从云端流向边端，未来的机器人终端竞争，本质上是算力、功耗与 Token 成本的软硬一体平衡战。」

「芯片原厂不能只卖硬件，我们要做的是高泛化的端侧推理底座，用确定性的算力架构去承载不确定性的算法迭代。」

深圳湾：芯片的硬件开发周期通常长达一到两年，但大模型算法几乎是「按周迭代」的速度。瑞芯微作为芯片原厂，如何确保当前设计的异构芯片架构不会在一年后由于新模型的出现而成为过时算力？

王鹏程：这是所有芯片厂商面临的最大挑战。我们的解法是放弃追求针对单一特定算法的「硬核固化」，转而全力打造高泛化能力的端侧 AI 推理底座。通过设计具备极高弹性、支持多小参数模型广泛并行的 NPU 架构，配合标准的异构协作框架，让芯片成为一个可自由调度 Tools、本地知识库（RAG）和多模态编码的软硬件通用推理平台。算法在变，但端侧对算力调度、数据剪裁和异构协同的底层底座需求是不变的。

深圳湾：对于机器人整机厂来说，端侧芯片的算力往往和成本、功耗直接挂钩。在有限的硬件成本和电池续航限制下，瑞芯微如何帮整机厂做算力与成本的平衡？

王鹏程：天下没有免费的午餐，算力越高往往意味着功耗和成本越大。瑞芯微的思路是「把钢用在刀刃上」，不一味追求大参数，而是主张端云协同和软硬协同。在端侧，我们通过工具链把模型量化剪裁（如 INT4/INT8 量化），让中低算力的芯片也能跑起高表现力的轻量模型；同时，芯片设计上采用多核异构，不交互时大算力 NPU 彻底休眠，只留低功耗内核做常驻唤醒监听。通过这种精细化的「算力算账」，帮整机商跨过量产的成本门槛。

更多本场活动精华内容，请访问：