Uploads%2farticles%2f12314%2fcortana alexa
|
2018-05-08

与 Alexa 联姻、主打办公场景,微软在语音竞争中有了新思路 | Build 2018

从领先到落后,微软似乎想通了些什么。

一直以来,微软 Cortana 都是被拿出来分别与亚马逊、苹果、Google 这几家旗下 AI 语音助手作比较的对象。至于对比结果,微软也总不出意料的是排名靠后的那一个。

在 2018 年度微软开发者大会 Microsoft Build 举办的首日,微软宣布拆分其 Windows 业务、全面的进军 AI 和物联网的消息。而作为 AI 战略的重要技术支撑,语音 AI 也成为此次 Build 大会的一大亮点。

Cortana-Alexa 「联姻」有了最新的动向

早在去年 8 月份,亚马逊、微软就公布了双方旗下的语音人工智能系统将相互打通的消息。在这时隔半年多之后的 Build 大会中,微软方终于公布了该项目的最新进展。

在该环节中,微软方还邀请到亚马逊的一位负责人 Tom Taylor 配合 Demo 演示。

通过对 Echo 音箱说出「打开 Cortana」,微软负责人 Megan Saunders 唤出了 Cortana,过程就如打开 Alexa 的技能一般。之后,Megan 通过语音指令让 Cortana 为她读出了当天的日程安排、发送内容为「I’ll meet you tonight」的邮件给 Tom Taylor。

另一端的 Tom Taylor 则通过与 PC 端的 Cortana 对话调出 Alexa,实现了关灯、用 Alexa 的第三方 Uber 技能叫车等操作。

不过这些 Cortana-Alexa 合作功能都尚未正式开放,Megan Saunders 表示,在此之前,将会事先推出测试版本供小范围测试和使用。

通过演示和介绍,我们可以了解到,一旦 Cortana 与 Alexa 实现了平台间的互通,Alexa 用户便能够访问其在微软系统内相关的生产力信息,包括工作日程、会议安排以及邮件等。而 Cortana 用户则能跨平台实现 Alexa 对智能家居设备的控制,以及调动数量多达 4 万个第三方技能。

目前,不管是从智能设备接入量,还是从技能数来看,亚马逊 Alexa 都处于行业领先的地位。而对于在这两方面都不占优势的 Cortana 来说,拥抱 Alexa 是个能快速(甚至是「一次性」)补充短板的方案。

巧妙避开移动端、家庭场景市场争夺战,Cortana 在办公领域彰显潜质

作为公司的基础业务,Windows 系统和办公软件 Office 奠定了微软在办公领域的头号地位。如果说 Google 凭借 Android 系统占尽了移动互联网的红利,那么能稳坐互联网 PC 端头把交椅的就是微软了。

以搭载 Cortana 的智能音箱为基础,微软联手合作伙伴打造了全新的会议系统解决方案。其中,Cortana 身兼秘书、速记、翻译等多个职业身份,全方位展示了它「干练」的一面。

在会前,公司职员可通过与 Cortana 对话预订会议。在多人会议的场景中,配合指向性麦克风阵列、绑定员工电子档案的视觉系统,Cortana 可实时双语记录每位参会成员的对话信息,并基于语义分析做出会议纪要。纪要的内容主要包括「给谁发邮件/打电话」重点事项跟进等。

作为昔日对手,Alexa 一方面与 Cortana 达成了互通合作,另一方面也并没打算放手办公生产力领域。

去年底,亚马逊曾宣布即将推出企业版 Alexa 的消息,紧接着在今年初,Alexa 则以应用程序的形式登陆 Windows 10 系统,部分支持的品牌(华硕、惠普、宏碁)及相应产品也将陆续亮相。

就这一垂直领域,Cortana、Alexa 两者或将展开一场持久战。而就目前情况来看,主场作战的 Cortana 有更大的胜算。

推出 MSDDK 开发板,借助开发者的力量让语音技术落地更多设备

在设备落地情况方面,亚马逊、Google 之间的「军备竞赛」大家都有目共睹。前者靠智能音箱成功打开了市场,后者凭借 Android 生态的优势覆盖大量的移动端用户,目前各自都在不断扩张自己的硬件载体类型,小到灯泡、手表、音箱,大到冰箱、车载。

在这两年里,Cortana 已逐步从 Windows 中走出来,并应用到冰箱、温控器等设备上。这次,微软试图将语音 AI 能力释放出来,依靠广大开发者的力量,让技术落到实处。

本次 Build,微软 CEO 纳德拉正式发布了微软语音团队联合 ROOBO 共同研发的多 MIC 语音开发板 MSDDK(Microsoft Speech Device SDK),面向远场语音识别的软硬一体方案。这是微软至今在 AI 领域提供的第一个开发者硬件平台。

开发板使用高通 SOC 平台,面向不同的应用场景分为圆型 6+1MIC 和线性 4MIC 两种阵列形式。同时,配合 Azure 提供的认知服务,MSDDK 支持多种语言和知识技能,可以广泛应用于智慧家电,机器人,智能音响,机顶盒等多种场景。

目前,开发板已经在微软开发者平台开放预订,预计 7 月下旬正式全球发货。

小结

在诞生时间上,Cortana 比 Alexa 早两年。但战略上的差异导致两者后续发展差距拉大。

在这比 Alexa 早出的两年时间里,微软除了不断优化 Cortana 的功能之外,Cortana 还只停留在 Windows PC 和 Windows Phone 平台上。

直到 Alexa 用智能音箱重塑了人们对语音 AI 的认知之后,微软 Cortana 先后登陆手机端(iOS、Android 应用程序)、音箱、车载等。有几分跟苹果、Google、亚马逊在相同领域内进行分庭抗礼的味道。

而在这次 Build 大会中,我们看到了微软在语音赛道竞争中「智慧」的一面。一是通过合作的形式,将需要花费大量时间的语音生态建设工作放下;二是从自身擅长的办公领域出发,结合垂直场景对语音技术进行了深度打磨。

而对于微软自身而言,随着战略重心向云和 AI 的转移,语音 AI 的布局也将逐步走上「正轨」。

>>
Back to top btn