20
|
2021-07-13

乐鑫声学双麦克风前端算法通过 Alexa 语音服务认证

方案基于 ESP32-S3 SoC,后续将会扩展到更多 SoC

乐鑫科技 AI 实验室自主研发的声学前端 (Audio Front-End, AFE) 算法已被认证为 Alexa 内置设备的「软件音频前端」解决方案。

亚马逊为将 Alexa 语音服务(AVS)更好的推广应用,共设有通用音频前端开发套件、智能扬声器和条形音箱开发套件、耳机开发套件、智能家居开发套件、机顶盒/流媒体设备开发套件、智能屏幕开发套件、音频前端模块、软件音频前端解决方案在内的八大解决方案,通过认证的第三方芯片、模组、语音处理技术、软件,结合 AVS API 助力企业构建商业级语音产品,同时降低开发成本。

此次乐鑫 AI 实验室获得认证的声学前端算法即是 AVS 八大板块之一。值得注意的是,该板块下获得认证的还有思必驰、地平线及声智等国内企业。

乐鑫 AFE 算法可基于集成了 AI 和 DSP 加速的 ESP32-S3 SoC 进行声学前端处理,在只有两颗麦克风的配置下,仍然可以实现 360 度语音拾音。两颗麦克风间距可在 20mm~80mm 之间配置,为开发人员终端产品的硬件设计提供相当大的灵活性。

%E6%88%AA%E5%B1%8F2021-07-13_%E4%B8%8B%E5%8D%882

针对远场精准拾音的场景,AI 实验室还开发了一套远场拾音的算法框架,包括多通道声学回声消除 (AEC, Acoustic Echo Cancelation)、盲源分离 (BSS, Blind Source Separation)、语音活动检测和噪声抑制 (NS, Noise Suppression),以保证智能设备在远场噪声环境下,也能实现准确的语音唤醒和识别。

%E6%88%AA%E5%B1%8F2021-07-13_%E4%B8%8B%E5%8D%882

麦克风在拾取和过滤音频信号后,算法还会通过离/在线的方式对音频进行处理,实现更深层次的抑制噪声。

乐鑫 AFE 算法运行时仅需消耗 12-20% CPU 空间和 460 KB 存储空间(220 KB 内存和 240 KB 外部存储),能够为运行在同一 SoC 上的其他应用程序保留充足的资源空间。

据了解,后续推出的其他集成 AI 和 DSP 加速的 SoC 也将为 AFE 算法提供硬件支持。

编辑:达达 / 深圳湾

>>
Back to top btn