与 Alexa 联姻、主打办公场景,微软在语音竞争中有了新思路 | Build 2018
解读翻译机背后的技术:AI、语音和云服务 | 对话微软黄学东
做好一款翻译机没那么简单。
近年来,不少语音技术和设备商都瞄准海外旅游市场,将机器翻译技术落地到设备端,相继推出 AI 翻译机。其中,小米魔芋 AI 翻译机以 249 元创下了市场新低,是目前市面上性价最高的翻译机产品。这个「性价比」不仅体现在价格上,更在于其内置来自微软的 AI 翻译技术,代表着行业中英 AI 翻译技术的最高水平。
在上周举行的香港 Emtech HK 峰会上,微软首席语音科学家黄学东受邀发表了主题演讲,系统分享了微软自然语言和机器翻译技术发展的历程及其取得的突破性进展。在会后接受深圳湾(ID:shenzhenware)采访时,黄学东也重点谈到微软 AI 翻译技术及应用,以及支撑 AI 翻译机背后的技术、服务。
谈翻译: 机器可媲美达到专业人员的水平
语音技术领域,在过去几年里,微软多次的创造了接近人类水平的人工智能技术。尤其在今年 3 月,微软创下机器语言史上新的里程碑:其机器翻译系统在通用新闻报道的中译英测试集上,达到了人类专业译者水平,也是业界首个在新闻报道的翻译质量和准确率上媲美人类专业译者的翻译系统。
中译英机器翻系统由微软的美国团队和中国研究院团队共同研发,不仅代表微软 AI 翻译技术上的重大突破,还意味着,与人类同等水平的翻译技术能够帮助中国语言和中国用户走向世界。
在国内,微软积极推进与各公司合作,将技术带到行业端和消费市场。其中,华为的 Mate 10 预装了微软认知服务的机器翻译系统,小米生态链企业香蕉出行于今年 5 月份推出的魔芋 AI 翻译机,就内置了微软翻译技术,能实现 14 种语言互译。(点击了解:《魔芋 AI 翻译机评测:小米生态链首款,搭载小爱同学,仅售 249 元要「掀翻」同类市场?》)
实际上,此前微软的 AI 翻译技术已经在许多产品中落地。例如在微软 Office 中为用户提供同声翻译服务:在办公软件的 Power Point 中安装 Presentation Translator 插件,课堂、演讲场景下,可实现实时转文字、同声传译等功能,支持 60 种语言、100个人在课堂上同步交流,学生/听众可通过微软翻译的手机应用,加入对话同步交流。
谈语音:翻译机上的语音技术跟智能音箱的是互通的
在这两年来,智能音箱的火爆,进一步带动语音识别、远场拾音等技术在行业上的应用。在这方面,微软也取得不少领先业界的研究成果。
在今年的 Build 2018 大会上,微软正式发发布了面向远场语音识别的软硬一体方案——多 MIC 语音开发板 MSDDK,该方案由微软语音团队联合 ROOBO 完成,搭载微软语音 AI 的算法。
在这一方案的基础上,任何一家公司都可以将这套技术打包到他们的服务系统中, 并打造智能音箱、机器人等智能硬件产品。
该方案涵盖微软在过去多年积累的语音识别、语音合成、机器翻译等自然语言技术。其中,远场语音识别技术同样为 AI 翻译机奠定了硬件和算法上的基础。
谈云服务:AI 技术的发挥,需要云的高度配合
以上提到的包括机器翻译、语音识别、语音合成等多项语音 AI 技术,均已经集成在微软 Azure 云服务上。「微软将这 30 多年以来的 AI 研发成果,包括最底层的核心架构、最高层的算法和认知服务都打包到 Azure 云上,并面向所有人开放、分享微软的最新人工智能研发进展和工程化的结果。」
而这些技术,在微软的 Azure 云服务的配合使用情况下,得以更好的发挥。
在谈及技术在产品落地时,黄学东表示,以微软和小米联合推出的魔芋 AI 翻译机为例,这款产品集成了微软包括拾音、机器翻译、微软 Azure 云等在内的技术。
作为当下市场上价格最低的翻译机产品,魔芋 AI 翻译机拥有微软 AI 翻译技术的支撑,在提供翻译效果的同时,以低价位获取更多受众,能让微软的语音 AI 技术更快的普及用户市场。
翻译机的用户体验,关系到语音识别准确率的高低、网络连接稳定与否等。黄学东表示,由于微软在支持翻译语言的国家均设有数据中心,能在设备在当地使用的情况下,确保数据的稳定性传输,从而提供优于不少国内品牌产品的翻译体验。
据香蕉出行技术副总裁于亮反馈,国内不少用户会倾向于将这款魔芋 AI 翻译机推荐给国外朋友,甚至有人专程从国外跑到国内购买产品。因此,他们已有产品向海外市场进军的计划。
据黄学东透露,微软 AI 翻译技术研究目前已有阶段性成果和突破,在未来几个月,将会在云端上进行升级,给现有客户、产品用户带来更大的惊喜。
公众号:shenzhenware
主笔、采访:莱恩
题图来源:Emtech