科大讯飞开放平台产品总监王磊:声音的力量,语音交互在虚拟现实中的应用

柳雪 柳雪 发布于2016-04-18 19:06

4 月 16 日,由深圳湾主办的 WARE 2016 新硬件生态大会上,科大讯飞开放平台产品总监王磊,就与大家分享了主题为「声音的力量:语音交互在虚拟现实中的应用」的演讲。


在国内智能语音技术方面,科大讯飞早已被各大厂商熟知与青睐。科大讯飞在智能语音方面的进步与发展,使得我们在日常生活中看到各种各样的语音技术的应用。虽然触摸屏和键盘仍然是今天人机交互主要媒介,但未来语音交互或可平分天下。智能语音的发展将推动人工智能和虚拟现实的发展,使我们的生活变得更加有趣。

智能语音在未来行业应用上的无限遐想,而虚拟现实无疑又将是值得深挖的热门领域!WARE 2016 新硬件生态大会,作为科大讯飞开放平台产品总监的王磊,演讲内容也主要围绕虚拟现实来展开,主要分为三个部分:科大讯飞的云技术如何;语音技术、交互服务与 AR 和 VR 的适用;科大讯飞最新的语音交互进展。

科大讯飞的云技术如何

其下讯飞开放平台提供的服务有:1. 语音变成文字 2. 语音合成(比如导航里听见的林志玲的声音)3. 语音理解的技术(比如看视频的过程中,语音即可完成相应动作的操作)4. 离线技术(家里断网时,机器人可以做简单的操作,比如把空调打开)。此外,平台还提供语言唤醒、声纹、人脸识别等技术。目前,科大讯飞对外形成了 13 万的合作伙伴,包括腾讯、微博都在使用相关服务。



语音技术、交互服务与 AR 和 VR 的适用

对于与 VR 交互服务,在演讲中,王磊提到了云交互技术在 VR 场景上的应用,虽然介入不久,但期待做更多的突破及思考!

例如:

在教育领域的应用,用户戴上设备就可以在 AR 或 VR 的场景里学习,老师上课,用户在下面进行互动。


在游戏领域的应用,语音合成、命令词控制可以用于游戏的体验和操作。提供给用户更好的交互体验


在视频领域的应用,在 VR 上看电影是种享受,可是操作体验不行,当用户头戴设备时,需要快进、快退、搜索视频时,需要更加便捷自然的交互形式,那么语音是最好的方式。


科大讯飞最新的语音交互进展

最后,谈及科大讯飞最新的语音交互进展。其实在去年 3 月 21 日,科大讯飞就已经发布了现在最新的方案:人机交互的解决方案,已经解决了以前在人机交互中出现的「疑难杂症」问题,比如方言的口音、多人的交互对话,包含交互对话过程中,机器想纠错,但纠错不了,或者机器不能理解你说的话的意思。

目前,科大讯飞提供一套整合的方案服务,包括语音合成、识别、语音理解、人脸等,通过方案的形式,用户只要接入同一套接口,在云端可以进行供选或者配置,这些服务将会广泛应用在 AR 与 VR 技术中。

把一件事做到极致,把这项技术看成自己的孩子,持续的把它做得更好更棒,为合作伙伴提供更多的价值。相比会是科大讯飞接下来不断探索和努力的方向!也期待科大讯飞能在行业内起到更加重要及关键的作用。

6
1 评论
陳壹零
陳壹零 1 年前
1 楼

语音融入虚拟现实,用语音操控虚拟世界

Back to top btn