随时唤醒语音助手,真不是一句话的事儿 | 深圳湾夜话
声加科技推出低功耗语音本地唤醒 + 双麦 SVE 降噪技术方案,助力 TWS 耳机智能化
高效、高品质 TWS 耳机技术解决方案
耳机搭载语音助手已经成为目前 TWS 耳机的主流趋势,但目前市面上绝大部分产品使用的还是以基于手机的语音识别方案,用户每一次的语音指令都要首先唤醒手机语音助手,造成响应速度较慢(切换歌曲需要等待 5~6 秒)。不少用户因此放弃了语音唤醒功能,宁可使用手势或按键,甚至只能拿出手机进行操作,体验欠佳。
这主要受限于耳机运算能力较弱,电池续航时间短,耳机设备端进行精确的语音识别造成了极高难度。声加科技推出了一系列解决方案,以解决 TWS 耳机实时唤醒、语音交互的诸多问题。
关键词唤醒(KWS)有限语音命令方案
声加科技的关键词唤醒(KWS)有限语音命令方案,可实现唤醒低功耗计算方案,KWS 启动和手机语音交互,有限语音命令实现切歌、调音量等基本操作。在算法所需资源消耗上,低至 30Mips, 50KBytes memory 的唤醒词模型(m4f 平台),模型规模可变,能根据产品计算资源快速调整模型,还能整合声加自有前端语音增强,优化整体性能。
双麦 SVE 降噪技术方案
SVE(Soundplus Voice Enhancement)降噪技术可以广泛应用于耳塞式耳机、半入耳式耳机、入耳式耳机、头戴式耳机、挂耳式耳机等,是通过双麦克风阵列,精准计算通话者说话的方位,在保护主方向目标语音的同时,去除环境中的各种干扰噪声,例如其他人的讲话声、交通工具产生的噪音、风噪声等等,有效抑制 90% 的反向环境噪声,由此降低环境噪声最高可达 30dB,保证高品质通话效果。
其核心技术包括:
- 回声消除 AEC:支持单通道回声抵消、双通道立体声回声抵消,可在设备自身播放大音量时轻松唤醒,ERLE>30dB。
- 声源定位 Direction of arrival estimation:支持多源定位,以及在强混响及噪声干扰情况下准确定位目标声源;
- 定向拾音、环境降噪(尤其是风噪抑制):能有效降低通话时的环境噪声,即使身处嘈杂环境,也能保障高清晰的语音识别以及通话质量。耳机使用场景复杂且运算资源受限,如果只依靠基于深度学习的小资源语音识别模型,在嘈杂环境下会存在误识率高、识别率低的问题。
目前,声加科技的耳机技术方案已应用在了华为 Flypods、小米 Air、小米 Air2、万魔 EM001、万魔 EM004、京东京鱼座等产品上。
编辑:陈宇凡 / 深圳湾
题图:小米 Air 2