小米 AI 实验室六篇论文获 ICASSP 2022 收录,多模态语音唤醒挑战赛夺冠

2022-02-08 10:51

湾里湾外消息,在全球语音、声学顶级会议 ICASSP 2022 公布的入选论文名单中,小米 AI 实验室六篇学术论文被接收。小米「自由说」系统在 MISP(基于多模态信息的语音处理)挑战赛中荣获多模态语音唤醒第一名和多模态语音识别第二名,并受邀在今年 5 月的全球会议上向工业界和学术界进行方案报告。这也是小米语音方向取得的第六个世界级比赛冠军。

ICASSP 是国际声学、语音与信号处理会议,是 IEEE 主办的全世界最大的,也是最全面的信号处理及其应用方面的顶级会议,在国际上享有盛誉并具有广泛的学术影响力。小米 AI 实验室被录用的论文涉及语音识别、语音合成、声学语音质量评价等诸多方向。

在语音领域,小米语音团队在 2017 年开始在学术顶会发表重要论文,并在 TTS 语音合成全面自研以及在合成的韵律、个性化、以及情感这三个方面实现了重大的突破;智能生活助理小爱同学的声音定制效果、合成流畅度与稳定性、合成的情感化都有显著提升。

同时,小米在语音唤醒和预训练方面进行了深入研究,提升了手机个性化语音唤醒和小米闻声的性能,降低了小爱误唤醒率,保障了语音唤醒的质量,受到 ICASSP 的审稿人的高度评价。

在声学领域,小米声学团队致力于 AI 声学技术的研究及工程落地,为小米手机及 IoT 全生态硬件产品打造业界领先的音频体验。目前 AI 通话降噪、协同唤醒、协同放音、空间音频等技术已在手机、电视、小爱、耳机等 60 余款产品中落地。四年来累计过审专利已达 123 项。未来,小米将不断探索科技新高度,为大家带来更多黑科技,让更多人享受科技带来的美好生活。


Back to top btn