2019-10-16

声加科技推出低功耗语音本地唤醒 + 双麦 SVE 降噪技术方案，助力 TWS 耳机智能化

高效、高品质 TWS 耳机技术解决方案

耳机搭载语音助手已经成为目前 TWS 耳机的主流趋势，但目前市面上绝大部分产品使用的还是以基于手机的语音识别方案，用户每一次的语音指令都要首先唤醒手机语音助手，造成响应速度较慢（切换歌曲需要等待 5~6 秒）。不少用户因此放弃了语音唤醒功能，宁可使用手势或按键，甚至只能拿出手机进行操作，体验欠佳。

这主要受限于耳机运算能力较弱，电池续航时间短，耳机设备端进行精确的语音识别造成了极高难度。声加科技推出了一系列解决方案，以解决 TWS 耳机实时唤醒、语音交互的诸多问题。

关键词唤醒（KWS）有限语音命令方案

声加科技的关键词唤醒（KWS）有限语音命令方案，可实现唤醒低功耗计算方案，KWS 启动和手机语音交互，有限语音命令实现切歌、调音量等基本操作。在算法所需资源消耗上，低至 30Mips， 50KBytes memory 的唤醒词模型（m4f 平台），模型规模可变，能根据产品计算资源快速调整模型，还能整合声加自有前端语音增强，优化整体性能。

双麦 SVE 降噪技术方案

SVE（Soundplus Voice Enhancement）降噪技术可以广泛应用于耳塞式耳机、半入耳式耳机、入耳式耳机、头戴式耳机、挂耳式耳机等，是通过双麦克风阵列，精准计算通话者说话的方位，在保护主方向目标语音的同时，去除环境中的各种干扰噪声，例如其他人的讲话声、交通工具产生的噪音、风噪声等等，有效抑制 90% 的反向环境噪声，由此降低环境噪声最高可达 30dB，保证高品质通话效果。

其核心技术包括：

回声消除 AEC：支持单通道回声抵消、双通道立体声回声抵消，可在设备自身播放大音量时轻松唤醒，ERLE>30dB。
声源定位 Direction of arrival estimation：支持多源定位，以及在强混响及噪声干扰情况下准确定位目标声源；
定向拾音、环境降噪（尤其是风噪抑制）：能有效降低通话时的环境噪声，即使身处嘈杂环境，也能保障高清晰的语音识别以及通话质量。耳机使用场景复杂且运算资源受限，如果只依靠基于深度学习的小资源语音识别模型，在嘈杂环境下会存在误识率高、识别率低的问题。

目前，声加科技的耳机技术方案已应用在了华为 Flypods、小米 Air、小米 Air2、万魔 EM001、万魔 EM004、京东京鱼座等产品上。

编辑：陈宇凡 / 深圳湾

题图：小米 Air 2

TWS