科大讯飞开放平台产品总监王磊:声音的力量,语音交互在虚拟现实中的应用
你的产品植入人工智能了吗?先从语音交互技术开始做起吧
万物互联迈向万物智能,AI 将会成为物联网时代的基础设施,语音技术是基础设施的核心部件。语音技术的发展是整个物联网发展过程中最重要的交互方式之一。
谷歌 CEO 在前不久回答投资人的提问时,强调人工智能的重要性,直言已到了引爆点。这些互联网人整天谈 AI,做硬件的人听着热闹、玄乎,落到每一个终端硬件,目前最广泛的应用还是语音和语义。
万物互联迈向万物智能,AI 将会成为物联网时代的基础设施,语音技术是基础设施的核心部件。
我们先来理解万物互联是如何实现万物智能的。
首先,硬件联网阶段,硬件接入互联网,获取云端信息,进行远程操控,达到互通互联。接下来,进入硬件智能交互阶段,人可以与硬件直接通过语言交流,通过语言获取各种服务。最后进入硬件智能化阶段,硬件具备学习、感知、决策的能力,会了解主人的性格、情绪和习惯,具备云端大脑,具有决策能力,能够更好的为主人服务。
在这整个实现的阶段,AI 技术将作为基础设施推动整个智能硬件从联网阶段到智能化阶段的进程,让所有「机器」都是成为具备「智慧」的机器人,最终由万物互联走进万物智能时代。
语音技术的发展是整个物联网发展过程中最重要的交互方式之一。
从技术层面上讲,AI 技术主要包括:语音识别、自然语言处理、计算机视觉。AI 成为物联网时代最重要的基础设施之一,相关核心技术就是组成基础设施的核心管网。
在 PC 时代,键盘是最重要的交互方式,智能机时代,触屏是最重要的交互方式,而物联网(机器人)时代,语言将成为最重要的交互方式之一。这意味着未来整个机器人生态链,从上游的芯片、方案到终端产品研发,从系统底层机器人 OS,到上层 UI,应用开发,数据存储,内容呈现等等从都必须围绕语音交互这种新的交互方式。
那么由此可见,掌握语音交互核心技术的平台级公司未来或许会发挥巨大的价值,比如,唤醒、远距离语音识别、语义理解等。
语音交互技术在一些领域已成为刚需,市场规模呈现爆发式增长态势。
就目前来说,语音交互技术主要有以下几条线路。
第一:语音交互技术的应用从下游终端往上游方案商、芯片走,形成软硬一体化解决方案,出货量数量级倍增。
第二:从车载、智能家居、玩具等垂直领域场景率先爆发,出货量达百万级别,语音交互成为标配。
第三:语义识别需求爆发,与内容和场景紧密结合
语音识别需求爆发后,语义识别(即自然语言理解)需求也随之爆发。语音识别是将一段音频变成文本,但这段文本是什么意思,就需要进行语义解析。当智能硬件(机器人)「能听会说」之后,更重要的是让其和人一样学会「理解」和「思考」,而且这种「理解」和「思考」需要与特定领域和场景相结合。
目前语音技术的应用场景和产品还不够多,当未来亿万家庭中的数十亿设备以语音交互作为主流交互方式,这条管道像太平洋那么粗时,万物智能时代就真正来临了。
· 亚马逊出品的 echo 是语音交互终端的领先者
国内哪些语音交互技术的公司值得关注?
暂不考虑 BAT 等巨头的情况下,国内语音技术产业界将分为三股势力。
第一股势力以做语音助手起家的公司:聚熵智能、图灵(虫洞)、出门问问
聚熵智能:推出国内第一个中文 siri 产品——智能 360,全球第一个推出 Home AI 智能产品——小智超级音箱,比亚马逊 Echo 早半年推出。2015 年推出小智管家机器人和 Home AI 云平台,后者让智能设备具备从感知与认知的能力。其关键能力包含音乐,智能设备互联互通,生活服务以及机器深度学习等,朝着机器人时代的「Google」方向发展。
· 聚熵智能发布的小智管家机器
图灵(虫洞):推出虫洞语音助手,虫洞语义云,图灵机器人等产品,图灵机器人是一款机器人大脑,可为智能化软硬件产品提供中文语义分析、自然语言对话、深度问答等人工智能技术服务。
出门问问:中文语音智能交互手表 Ticwatch,以及中文语音交互智能手表操作系统 Ticwear。支持中文语音交互,周边热点查询、语音打车等多样本地服务,前几天刚推出针对车载领域推出开车问问。
第二股势力是以做语音识别起家:讯飞、云知声、思必驰
讯飞:国内语音巨头,既做语音技术提供方,也提供软硬一体化方案,以及开发语音产品(讯飞语点、开心熊宝、叮咚音箱等)。
· 讯飞与京东联合出品的叮咚智能语音音箱
云知声与思必驰:两家也是做语音技术提供方,同时提供软硬一体化方案(车载、智能家居、机器人领域)。
第三股势力是以 BAT 巨头前人工智能负责人创办企业:地平线机器人、杭州灵伴科技有限公司
地平线机器人:前百度深度学习研究院创始人余凯 2015 年 8 月创立,推出面向自动驾驶的「雨果」平台,面向智能家居的「安徒生」平台,号称要做「机器人时代的英特尔」,使「智能硬件」变「机器人」。
杭州灵伴科技有限公司:前阿里 M 实验室负责人 Misa 创办,推出了一款强劲的产品 —— 语音陪伴机器人 rokid,号称要做「机器人时代的苹果」。
· 提供家庭解决方案的 Rokid 陪伴机器人
尽管这里并没有谈 BAT 巨头在 AI 和语音技术的布局,但巨头的影响无处不在。以上三股势力,几乎每一家背后都有巨头身影。
未来
可以预见,未来的智能硬件,将进化为「机器人」,拥有「大脑」和「智慧」。而作为组成基础设施核心部件的语音技术,将是智能硬件(机器人)时代最重要的交互方式,并将深刻影响产业变革。
随之而来的是,语义识别需求的爆发,语义识别的平台级公司会有巨大的价值。而由于语言文化壁垒,针对中文语义解析,国内公司有着天然优势。平台之王,最终落到 BAT 还是新兴的创业公司,我们还不能给出定论。但我们期待着新硬件生态的繁荣。
这篇文章很有用