Uploads%2farticles%2f11920%2f2
|
2017-11-17

赋能你的手机、你的家、你的车,DuerOS 唤醒万物的盘子可能比你想象还要大

我们期待着 DuerOS 能为整个语音智能行业带来的勃勃生机。

DuerOS 是 AI 时代的 Android。」

4 个月前,当景鲲喊出这一句口号时,许多人觉得这只是巨头自信心过剩的大话。然而短短 4 个月里,DuerOS 新增 130 余家合作伙伴、落地硬件解决方案超过 20 个、每月有 5 款以上搭载 DuerOS 的设备推出……DuerOS 迭代平台、整合生态、将对话式 AI 能力进行产品化落地的速度,让怀疑的声音很快安静下来。

11 月 16 日召开的「百度世界大会 2017 」上,DuerOS 发布了全面升级的 DuerOS 2.0 对话式 AI 操作系统,并相继推出了一系列推进产业链变革和产学研联动的措施。

对话核心系统:让设备更智能,用户体验更好

在智能音箱这个新兴的消费产品市场,许多人工智能产品被诟病为「人工智障」,究其原因还是人机交互设计和智能化程度的不成熟。DuerOS 要赋能万物,成为世界级 AI 系统的标杆,必须提升自身交互体验的能力,拔高全行业最高水平,同时推高行业平均水平。

联合渡鸦,发布三款搭载 DuerOS 2.0 的硬件产品,打造软硬一体化设备标杆。图为 raven R 六轴情感机器人。

这一版升级的 DuerOS 2.0 系统,在核心技术能力层面,提升了准确快速的语音唤醒能力、流畅自然的语音识别能力、生动鲜活的合成语音、以及更加丰富的 AI 能力。

语音唤醒能力方面,实现了一句联控、任意打断、波束成形、噪声抑制、混响抑制、阵列增益、回声抵消。其中,无间断唤醒、清唱识曲,这两项用户使用频率较高的设备能力,在这一版有了较好的表现。

语音识别能力方面,百度的上亿级近场数据,为远场设备做了调优铺垫,识别准确率有了大幅度的提升。高频词做了全面优化,中英文、多种说话方式和口音的一体化建模,大大降低了设备的误识别率。在语音语义一体化识别上,也更加流畅。

合成语音能力方面,DuerOS 基于深度学习的情感拼接合成,全新定制的高度拟人化的合成音,「小度」的声音将更加生动鲜活。

除此之外,新版 DuerOS 还集成了包括人脸识别、图形识别、音频旋律匹配与检测技术、大数据控制与分析技术等更加丰富的 AI 能力,为智能设备的功能扩展预留空间。

用户体验是对话式人工智能生态系统的核心。DuerOS 希望达到的效果,是能让用户在不同的场景下,能够自然的使用设备、并且习惯一直使用这个设备,并让用户越来越习惯智能化的生活。

DuerOS 的智能家居体验间

智能设备开放平台:加快赋能硬件设备

在过去的几个月里,DuerOS 不停歇地推动着搭载 DuerOS 能力的硬件设备陆续落地。一方面,我们看到了包括中信国安广视、小鱼在家、海尔、美的、联想、哈曼、TCL、极米、小天才等众多知名企业与 DuerOS 的品牌联合;另一方面,DuerOS 也在将对话能力应用到手机、电视、音箱等智能家居、智能穿戴和车载场景中。

为了更快的推进各行各业的赋能,DuerOS 在解决方案方面也进行了全面升级,包括更好的远场语音交互开发套件全新的语音交互 App 解决方案全新的 DuerOS for Apollo 解决方案、以及全新的跨场景跨设备解决方案

李彦宏在百度世界大会上通过手机百度,在语音播报新闻信息流内容时,用自然语言交互进行播报控制及深度信息挖掘的体验展示,正是基于 DuerOS 2.0 提供的语音交互 App 解决方案。

除此之外,DuerOS 还对平台体系进行了升级,包括新增的物联网设备云、智能设备质量认证支持,平台体系更加丰富。

搭载 DuerOS 的智能手机 HTC U11,图片来源:爱搞机

技能开放平台:让设备拥有更丰富的内容、服务、和特定场景的对话能力

4 个月前,我们在做语音技能的深度报道时,还需要通过 App 开发做类比,以阐述技能的概念,并渲染在 AI 时代,语音技能开发的未来前景。然而不到半年的时间,国内厂商陆续发布了各自的语音技能平台。人们对于技能关注的目光,也逐渐从「是什么」、「为什么」,转向「怎么做」。

百度自己评价对话式 AI 产品体验的核心指标是听清、听懂与满足能力,其中的满足就体现在内容及服务生态的丰富度上。DuerOS 已经可以提供 10 大类、超过 100 项原生技能给用户,让用户体可以体验包括影音娱乐、信息查询、出行路况、聊天休闲、生活服务等技能。

为了让用户享受到丰富多彩的技能,DuerOS 不仅大幅提升了原生技能的丰富度与用户体验,还发布了小度技能开放平台,兼容了 UNIT、ChatFlow、STOR/AOR、ruyi 等多种技能开发工具,让开发者借助平台,真正实现「一站式」、「零门槛」的语音技能开发。

目前,DuerOS 的技能生态已拥有超过 100 个原生技能和 100 个第三方技能。未来,将会有更多诸如成语接龙、星座运势、饮食百科的语音技能上线 DuerOS 技能商店。

推动对话式人工智能在产、学、研三方面全面发展

要成为世界级人机交互的标杆,更好的推动行业发展和更优秀的产品体验,DuerOS 可以做的更多。

对话式 AI 技术正在重新定义人机交互的方式。为引领和定义最好的人机交互,DuerOS 成立了百度人工智能交互设计院,未来将以报告输出、产品测评等形式,帮助 DuerOS 的合作伙伴和全球 AI 产品在交互设计上不断提升优化。

同时,为了进一步提高对话式 AI 领域的技术领先优势,DuerOS 最新的普罗米修斯计划正式起航,这个计划包含开放超大规模对话式 AI 数据集、跨学科合作等多种计划,以及一个 100 万美元的基金用以鼓励和培养对话式 AI 领域的优秀项目和人才。

DuerOS 将推动对话式人工智能在产、学、研三方面全面发展。唤醒万物、全面领跑语音智能行业的 DuerOS 将最有能力成为那个为智能创造更多可能的平台。

图片来源:11/16 日百度世界大会景鲲演讲 PPT

展望

过去的 4 个月,是整个语音智能行业特别突飞猛进的 4 个月。国外,Google 推出了智能音箱全家桶,亚马逊发布了二代 Echo 并推进 Alexa 技能付费政策,苹果供应商爆料 HomePod 将搭载 Face IDSony 等厂商也相继推出带屏幕的智能音箱。这些都是特别好的信号,巨头推动产业变革的速度,总能超出人们的想象。

国内,一个双 11 将百箱大战推到了一个新高度。产品公司积极的向普通消费者普及智能音箱,在家里、在车上、在酒店,场景化的对话式人机交互已经无处不在。另一方面,平台公司则面向开发者,相继开放了自己的语音智能平台能力,开发者申请开发板和参与技术沙龙的热情高涨。整个行业保持的这种热情,推动着人机交互的变革走进每一个家庭,让对话式 AI 成为一个生活必需品

这是一个最好的时代。要成为时代的领跑者,不仅要成为披荆斩棘的创新者和开拓者,更需要成为纵横捭阖的整合者。百度是国内最早进入、最大投入、最完整布局的 AI 公司。作为百度 AI 能力和资源集大成者的一个缩影,以及对话式人工智能的一个缩影,DuerOS 充分发挥了可以贯穿技术、产品、平台、生态的垂直整合能力。

我们期待着 DuerOS 能为整个语音智能行业带来的勃勃生机。

>>
Back to top btn