20
|
2020-04-20

CEVA 发布业界首个高性能传感器中枢 DSP 架构

将主要用于处理情境感知设备中的多种传感器处理和融合工作负载。

随着低功耗高性能、多模态交互能力、边缘计算和本地控制、分布式控制等趋势技术的应用突破,IoT 也正在朝更普及化的方向发展。

伴随着技术的演进,手机、智能家居设备、语音助手、AR/VR 设备、耳机也将有更多的在终端上的创新体验和功能,但同时也加大了对硬件端及算法上的要求。

近日,全球知名 IP 授权商 CEVA 发布了业界首个高性能传感器中枢 DSP 架构 SensPro™,其将主要用于处理情境感知设备中的多种传感器处理和融合工作负载,为满足智能家居设备、语音助手、AR/VR 设备、耳机等对于传感器(摄像头、雷达、ToF 等)所生成的图像、声音及运动数据的计算需要。

当下,传感器正在变得越来越智能,除了获取更多数据外,还将承担着为环境感知提供更精确的数据建模。例如在使用结合了麦克风、压力、湿度、惯性、温度和气体传感器的环境传感器中枢(智能家居/办公室),以及 ADAS/AV 中的环境感知。其中,许多传感器(雷达、摄像头、IMU、超声波等)还必须能协同工作,更加大了计算难度。

SensPro 的全新架构结合了高动态范围信号处理、点云创建(point cloud creation)和深度神经网络(DNN)训练的需求,能够支持高性能单精度和半精度浮点数学功能,并且为语音、图像、DNN 推理处理和同时定位和映射(SLAM)提供 8 位和 16 位并行处理能力。同时应用广泛使用的 CEVA-BX 标量 DSP,可提供从单传感器系统设计到多传感器的情境感知设计的无缝移植路径。

  • 先进的微体系架构,结合了标量和矢量处理单元,在 7nm 工艺节点处的运行频率为 1.6GHz;
  • 集成了用于控制代码执行的 CEVA-BX2 标量处理器,性能达到 4.3 CoreMark / MHz;
  • 采用宽 SIMD 可扩展处理器架构进行并行处理,可配置多达 1024 个 8x8 MAC、256个16x16 MAC,专用的 8x2 二进制神经网络支持,以及 64 个单精度和 128 个半精度浮点 MAC,使得 SensPro 在 8x8 网络推理、二进制神经网络推理和浮点运算的性能分别高达 3 TOPS、20 TOPS 和 400 GFLOPS;
  • 可提供每秒 400GB 带宽的内存架构、4 路指令缓存、2 路矢量数据缓存、DMA 以及用于从数据交换中减轻 DSP 负荷的队列和缓冲区管理器;

SensPro DSP 将主要先提供三种配置,每种配置均包括一个 CEVA-BX2 标量处理器和各种矢量单元,经配置用于实现最佳的用例处理:

  • SP250:具有 256 个 8x8 MAC 的单矢量单元,瞄准图像、视觉和以声音为中心的应用;
  • SP500F:具有 512 个 8x8 MAC 和 64 个单精度浮点 MAC 的单矢量单元,瞄准以 SLAM 为中心的应用;
  • SP1000:具有 1024 个 8x8 MAC 和二进制网络支持的双矢量单元,瞄准以 AI 为中心的应用;

为便于加快系统设计,SensPro 还配备有一套先进的软件和开发工具,包括 LLVM C / C ++ 编译器、基于 Eclipse 的集成开发环境(IDE)、OpenVX API、OpenCL 软件库、带有 CDNN-Invite API 以加入自定义 AI 引擎的 CEVA 深度神经网络(CDNN)图形编译器、CEVA-CV 图像功能、CEVA-SLAM 软件开发套件和视觉程序库、ClearVox 降噪功能、WhisPro 语音识别、MotionEngine 传感器融合以及 SenslinQ 软件架构。

>>
Back to top btn