Uploads%2farticles%2f11499%2f           ware 2017         20170415.002
|
2017-04-18

在这个行业首次聚焦语音智能的主题峰会上,我们思考语音技术对智能硬件提出的新挑战 | WARE 2017

几年前,我们谈起人工智能或者机器人的时候,首先想到的可能还是 AI、终结者、黑客帝国、里虚幻的形象。我们以为人工智能还只是存在于科幻电影里,但当我们一次一次的被这些大片震撼时,我们发现,其实,人工智能,已经走进了我们的生活里。

如今,以 Alexa 为代表的语音智能终端设备,凭借着「智能」与「连接」,逐渐出现在大众的视野。有人把它看成是钢铁侠中 JARVIS 那样的虚拟管家,也有人认为它提供了新的交互方式和交互界面…… 而应运而生的各种平台、技术、集成方案,也让这个生态更加的繁荣。

2015 年 4 月 11 日,我们在深圳举办了第一届以硬件创新为主题的千人大会(查看大会图文回顾);去年的 4 月 16 日,在「WARE 2016 新硬件生态大会」上,我们重新定义了「新硬件」(查看大会图文回顾)。时隔一年,WARE 大会将迎来一些新的变化,我们将大会拆分了分期举办的、更加聚焦的多场分论坛,紧跟科技创新和硬件行业的变化与趋势,并着眼技术和产品的商业化落地。

2017 年 4 月 15 日,我们在深圳湾召开的「WARE 2017 语音智能平台与应用峰会」,是「WARE 2017」的系列峰会之一,也是行业首次聚焦语音智能平台与应用的主题会议。

本次会议,深圳湾邀请到了来自国内外的语音技术提供商、硬件厂商的专家,包括搜狗公司语音交互技术中心总经理王砚峰、瑞声科技研发总监张金宇、Amazon Alexa 资深架构师 Travis Grizzel、Omate 品牌创始⼈兼 CEO Laurent Le Pen、优必选 Alpha 产品线负责人梁嘉豪、古古美美品牌创始人童建超,为与会的行业精英分享最新的语音智能平台技术和硬件产品开发经验。

搜狗王砚峰:面对 3/1000 的语音智能市场,语音助手核心要解决体验问题

我们在使用语音产品时,语音技术只是让设备「听得见」我们的声音,但是要让设备「听得懂」用户话中的信息,并且能够准确的回答用户提出的问题,那就是另外一回事了。

所以,王砚峰总结:「语言才是思想和知识的载体,语音只是围绕在语言这个核心上面的路径,未来人工智能能领域的发展重心,一定会慢慢地从语音偏向语言。」

现在小米、魅族、百度等各个移动平台上的语音系统日活总数是 200 万,而智能手机的量是 8.7 亿台,智能手机使用语音助手的比例还不到 3/1000,这是一个令人尴尬的数字。如何解决用户的实际问题,提升用户体验的满足感,王砚峰给出了如下几条建议:

  • 第一,优化语音识别准确率,这包括远场识别、噪声处理、口音处理等多个方面。不过,这几年语音识别技术的进步显而易见,通过大数据、语音增强技术、麦克风整列的融合,这些问题已经得到很好的解决。
  • 第二,设计 + 工程化。由于机器无法像人类一样掌握语言,所以需要对设备用户体验以及工程实现进行设计,方便人机交流。
  • 第三,场景化、功能化、知识化。为了让语音产品更加好用,需要在垂直领域对知识进行整理,从而达到最好的体验。
  • 第四,解决语言问题本身的难题。其实,对于语言的理解,最根本的还是靠技术和数据。

瑞声科技张金宇:从传统麦克风到智能麦克风,语音硬件产品首要解决的是功耗问题

语音是最自然的交互方式,能够解放用户的双手,并且随时随地工作,给我们反馈和信息支持。

对于老人和小孩来说,语音也是最适合的交互方式。他们很难了解最先进的技术,也很难操控智能家电,而语音技术能够让一些不太了解这些数码设备的人群,去很好地享受智能设备带来的便捷。

然而,为了满足智能交互的需求,语音技术在底层硬件上仍面临着很多挑战。

张金宇总结:「要让语音设备全天候待命,首先要解决的就是功耗问题。」

为了解决功耗的问题,瑞声开发了一款智能麦克风,其中耗电比较大的模块在不工作的时处于休眠状态,从而节省电量的消耗。这款智能麦克风最低可以做到 100 微安的功率,相当于从 99% 到 100% 的推进,可以真正地让用户不需要去顾虑这个功耗的问题。并且,这款麦克风阵列尺寸足够小,能够直接集成到语音设备里。

另外,张金宇强调,不论是音频硬件还是算法的解决方案,都需要在技术提供商和客户共同的努力下才能够实现最切合应用场景的解决方案。

亚马逊 Travis Grizzel :Alexa 的优势不在于现在能做什么,而是以后能做什么

语音交互是一种自然而有力的交互方式,它的应用空间十分巨大。如今,通过技术可以将语音编码成机器所能理解的指令,并且能让机器去学习使用它。

亚马逊 Alexa 资深架构师 Travis Grizzel 说:「自 2014 年亚马逊推出 Alexa 以来,该语音技术已经广泛应用于以智能家居为主的硬件产品中。」国内外科技媒体对 Alexa 也是一片赞誉,其中,Travis Grizzel 最喜欢的一条媒体评论是 —— 「Alexa 的优势不在于现在能做什么,而是以后能做什么。」

智能硬件产品植入 Alexa 语音技术,能够获得更高的「智能」。从亚马逊自家的 Echo 来看,它可以用于控制家里的智能家居设备,如果用户想在亚马逊网站上购买商品,也可以通过 Alexa 直接实现,订购食物和外卖也只是分分钟的事情。

另外,亚马逊的 Alexa 服务是开放和免费的,开发者可以用 Alexa 做出深入应用场景的解决方案,比如在汽车驾驶中,Alexa 的语音方案就有很广阔的应用空间。

在未来,Alexa 会更加开放,Echo 内部使用的组件也会逐渐开放给亚马逊的合作伙伴,帮助他们快速打造自身的产品。

Omate Laurent Le Pen: Alexa 给智能手表厂商带来的机遇与挑战

智能手表厂商 Omate 的创始人 Laurent 来自法国,他的公司从四年前就开始做智能手表。

起初,无论是资本还是市场,都不看好 Omate 的产品,但 Laurent 却对智能手表的执念颇深。经过了无数次的推翻和重新设计,Omate 智能手表终于在 2013 年的 4 月份上线 Kickstarter,并成功筹集了近 100 万美金。

虽然得到了用户的认可,资本市场也慢慢改变了对 Omate 的看法,但是,在苹果智能手表的热卖,以及来自中国大量竞品的双重挤压下,留给 Omate 的市场份额越来越小,Omate 再次陷入了困境。

此时,美国的亚马逊开始与 Omate 联系,希望将 Alexa 植入他们的智能手表产品中。通过亚马逊的 Alexa 语音技术,Omate 的智能手表再一次得到升级。为了让 Alexa 在智能手表上能够提供更好的服务体验,Laurent 从产品底层开始优化,以符合 Alexa 的认证。

Laurent 补充:「通过和 Alexa 的合作,我们找到了新的发展方向 —— 帮助客户的产品去对接 Alexa 服务,比如,我们就为德国的一家机器人公司的产品做了 Alexa 语音技术的融合服务。」

优必选梁嘉豪:集成 Alexa 技术,智能机器人探索海外本地化之路

在国内,做智能硬件的厂商很多,其中有不少出口国外的产品,当搭载语音交互功能的产品在进入海外市场时,国内厂商不得不面对语音交互的本土化问题。

优必选自成立以来,就已经把走过的路和淌过的水全经历了一遍,对于语音技术的海外本地化探索,自然有独到的经验。

梁嘉豪认为,语音技术海外本地化主要面临三个问题:

  • 语言本地化:语言本地化包括唤醒、ASR/TTS、NLP/NLU 个三方面,其中,唤醒指的是需要对唤醒词进行外文转化,NLP/NLU 则需要运用海量的本地数据进行训练。
  • 内容本地化:包括考虑新闻、故事、时区、音乐、天气、版权等的当地属性。
  • 云服务本地化:即服务器部署地的问题。若国内产品在国外使用时,依旧走国内服务器通道,则难以为用户提供良好的体验。

对于想要拓展海外市场的创业公司来讲,Alexa 是个不错的选择。Alexa 的麦克风阵列可以提供良好的用户体验,以及科学完整的内容指引,同时,在开发的过程中,Alexa 也能够提供大量的数据样本,对产品的声学模型进行训练。

要注意的是,目前厂商从向 Amazon 提交申请到最终让产品接入 Alexa 的时长大概为 2 个月,但随着越来越多厂商的申请接入,申请周期将会延长。

古古美美童建超:无论技术怎么改变,本质上都是对产品的打磨和提升

语音技术已经成为机器「智能」的入口,不少传统厂商也将智能语音的接入作为转型升级的一个重要战略。

2012 年,古古美美产品线开始向 WiFi 音箱转型,也正是海尔、美的等家电厂商相继将 WiFi 模块应用到智能家居的时期。据童建超介绍,古古美美之所以选择 WiFi 音箱这个转型方向,是因为考虑到音箱能发挥 WiFi 一对多连接、远距离传输的优势,实现远场操控、多房间使用的功能。另外,相比空调、冰箱等设备,音箱天生所具备的音频输出口可实现与人交互。

古古美美的音箱在升级换代的过程中「不免俗」地集成了第三方的智能技术,比如第三代音箱产品就接入了阿里智能,第四代音箱产品则搭载了 Alexa 语音技术。

童建超认为,古古美美产品的本质是一个音箱,所以确保有良好的音质是他们首先要考虑问题,无论技术怎样升级,最终都是要体现在产品和服务上。

通过对音箱产品的不断打磨,古古美美的音箱得到了不错的市场反馈。在 Amazon 购物网站上,古古美美第四代音箱产品 E5 的星级达到了 4.7,高于同类产品亚马逊 Echo 的 4.4 星级。

尾声:

人工智能已经成为科技领域一剂强有力的兴奋剂,而随之蓬勃而起的语音技术逐渐成为机器「智能」的入口。语音技术的快速发展,能让机器更好地与人交互,帮助机器更好的认知世界。因为机器唯有探测到、看懂、听懂、读懂这个世界,才能将其「智能」落到实处,真正为人类服务。

本次大会是深圳在「人工智能+硬件」的创新尝试,现场我们收获了很多与会者对大会主题和内容的肯定。时间仓促,以及嘉宾人选等因素,我们未能呈现更多我们原本计划呈现的内容,这些我们将在后续的「WARE 2017」系列峰会中,为大家逐一呈现。最后,感谢大会的场地支持方中诚·COMPASS,在 5 天的时间里协助我们筹备这次会议;感谢各位嘉宾亲临现场做分享,感谢深圳湾的铁杆粉儿们购票参会!我们很快会再见!(@深圳湾)

Back to top btn