Uploads%2farticles%2f11682%2fware       .081 2
|
2017-07-18

错过了这次影响全行业的语音智能峰会,这篇文章帮你抢救一下 | WARE 2017


7 月 15 日,全程由硬件创新社区深圳湾策划出品的「WARE 2017 语音智能平台与应用峰会 第 II 季」在深圳的泰华梧桐岛拉开序幕。从初创团队到行业巨头,从平台到硬件到内容,从人工智能公司到硬件设备企业再到传统音频企业……超过 400 名语音智能相关领域的先行者和资深人士,纷纷赶往现场,聆听大咖分享,洞悉潮流趋势前的先行者的实践和思考。全程 6 个小时的全体会议,从语音先行、能力开放、场景应用、百箱争鸣,共 4 个篇章,首次全方位的解读这个行业。

本文将带大家一起回顾这场盛会的精华内容。每一位嘉宾的演讲或对话全文,也将在接下来的这一周,陆续推送给大家。请大家持续关注深圳湾(微信公众号 ID:shenzhenware)。

时隔整整 3 个月,行业的变化还是出乎了所有人的预料 | 前言

开场,深圳湾向大家介绍了举办这个会议的初衷以及策划上的思考。

早在 3 个月前,当我们已经非常清晰地感觉到了语音结合人工智能之后所表现出的真实的能量,我们策划和组织了国内首个语音智能峰会。在 4 月 15 日的那场峰会上,我们邀请了在这个方向上树立起标杆的 Amazon Alexa,已经展示出在语音领域的发力的搜狗,以及围绕智能音频的方案提供者、制造商、和朝这个方向转型的传统音频品牌,来探讨在这个已经开始起来的新方向上,有哪些新的技术、产品、和商业的可能性。

短短 3 个月的时间过去了,国内语音智能领域所发生的变化,出乎了我们所有人的预料。4 月 18 日,人工智能创业公司 出门问问 发布了首款虚拟个人助理 问问。5 月 15 日,人工智能创业公司 Rokid 新一代智能音箱 Pebble 天猫正式开售。6 月 8 日,京东发布 II 代 叮咚音箱 及叮咚 TOP。6 月 18 日,音频内容平台喜马拉雅发布 小雅 智能音箱。6 月 22 日,腾讯发布语音智能平台 小微。6 月 28 日,科大讯飞发布成品级硬件平台 MORFEI 麦克风。6 月 29 日,云知声推出 Pandora 语音中控完整技术方案。7 月 5 日,百度发布 DuerOS 智能语音操作系统,启动最大规模开发者招募;阿里推出业内首款声纹购物 AI 音箱 天猫精灵 X1,内置语音助手 AliGenie。7 月 6 日,图灵发布面向儿童场景的 智能故事机方案。7 月 7 日,思必驰 DUI 开放平台 首秀……语音智能的生态在短时间内迅速繁荣。

在平台厂商、解决方案厂商、应用终端厂商、系统集成商、以及上下游企业的推动下,我们思考了将用怎样的内容和形式,去呈现给大家一个可以解读行业和相互交流的机会。除了紧跟这股潮流的脚步之外,还希望让大家看到潮流中的玩家在选择这个方向背后的思考,看到火热的语音智能繁荣背后的冷静思考,让每一位在周末赶来梧桐岛的深圳湾伙伴不虚此行。

四大主题论坛,首次深度呈现,多位重磅嘉宾,唤醒产业生态。我们和你们一起发出了「AI+硬件」开发者社区最强音,我们和你们一起探索着「智能硬件」创新者未来之路。

百度 景鲲:语音智能还在市场初期,DuerOS 要为智能产品解决基础问题

就在本次峰会召开的 10 天前,百度在北京召开了 AI 开发者大会,会上展示了百度集中发力人工智能以来的阶段性成果。百度的语音智能开放平台 DuerOS 则是百度展示的两大主要成果之一。当时,百度度秘事业部总经理景鲲从听清、听懂和满足三个基本维度介绍了 DuerOS,希望通过 DuerOS 这个开放平台唤醒万物。景鲲专程从北京来到深圳湾的活动现场,面向语音智能领域的硬件、内容开发者,进一步从产品落地应用的角度,解读了 DuerOS 能为硬件产品赋予的能力。

我们百度将用开放的平台和能力,帮助大家开发更高阶、更个性化的产品,所以百度没有竞争对手,大家都是合作伙伴。

景鲲在「WARE 2017 语音智能平台与应用峰会 第 II 季」上的这番话足以展示出 DuerOS 开放和赋能的决心。现在的语音智能领域还没到竞争的时代,在市场初期,最大的挑战是用户的使用习惯,需要大家联合推进。「可能只有 BAT、京东、小米等很多优秀的公司一起向前推进,普通老百姓才能真正感觉到人工智能时代来临了。」

景鲲用「听清、听懂、满足」三个维度定义了一个优秀语音智能服务体系的基本标准,在听清、听懂上,体现的是语音识别和语义理解方面的技术基础。在自然语言理解能力的优化上,百度在数据上积累优势得以体现,景鲲说道,DuerOS 给自己设立的目标是要能听懂「FREESTYLE」,即用户日常随意的表达方式,「这是我们的一个短期目标。」

谈到 DuerOS 的内容体系,DuerOS 已经拥有丰富的内容与服务,将全部开放给接入 DuerOS 的合作伙伴使用。同时,景鲲强调,包括两千万的音乐资源在内的所有内容资源都将全部免费提供,「我们自己承担内容的成本,就是希望能够更块地推进语音交互的发展。」DuerOS 还将集成更多来自第三方合作伙伴以及开发者的优秀内容。

面向不同需求的开发者,DuerOS 提供了三种开发套件。在软件方面,DuerOS 还开发了包含设备管理、技能商店在内同时具备支付功能的 APP「小度之家」,能够直接与接入 DuerOS 的设备配套使用,甚至可以让硬件厂商省去 APP 开发的成本。

值得一提的是,作为继百度 AI 开发者大会后首次与开发者们面对面交流,景鲲会后仍在现场与开发者们持续讨论了一个多小时。开发者的问题集中在如何获取到开发者资格和套件以尽快开始开发、硬件产品的联合推广和未来云端收入分成模式的相关细节,以及硬件企业在基于 DuerOS 打造批量产品时的具体对接方式等等。

海翼 Anker 阳萌:语音智能未来将普及为产品的标配功能,而产品竞争力最终还是要回归到产品本身

此前,海翼的 Anker 品牌主要是以其充电产品为人们所知晓。实际上,在语音智能领域,恐怕还找不出几家,像 Anker 一样,可以同时成为亚马逊 Alexa、Google Assistant 和百度 DuerOS 的首批合作伙伴。

在本次峰会上,海翼创始人兼 CEO 阳萌表示,此前 Anker 旗下充电产品的市场布局主要集中在海外,与百度 DuerOS 合作、进军语音智能产品,将是海翼在国内市场的新起点

阳萌强调,应该更多从「赋能」的角度来理解语音智能,思考语音智能作为一种新的交互方式能为现有的产品和场景带来哪些体验上的改进,而不应把它作为单一的孤立概念来看待。

谈到基于第三方平台的硬件产品如何做出差异化的问题时,阳萌认为,语音智能未来将普及为产品的标配功能,只是一个额外的加成,产品竞争力最终还是要回归到产品本身的特征上来,例如音响产品还是拼好的音质、好的设计,而不能只是靠语音和智能为噱头吸引眼球。

此外,除了在智能家居领域的布局,还以还看重语音智能在移动场景下的潜力。不久前,Anker 在 Kickstarter 众筹了一款可连接 Alexa 等语音助手的蓝牙耳机,正体现了这一点。「语音助手可以有两种形态,一种开放的,像是音箱这样的家庭中控;另一种则是私人的,供个人使用的,比如耳机。」

Rokid 祝铭明(Misa):组了博士团在线下零售店蹲点半个月,就是想知道用户怎么看我们的产品

Rokid 将自己定位于一家注重用户体验的人工智能产品公司,如何将技术转化为能够提供良好用户体验的产品,是 Rokid 思考最多的部分。现在的人工智能技术的整体水平,可能还无法支撑产品提供 JARVIS 那样的「完美」或超出预期的体验,在这样的技术和体验的博弈中,Rokid 是怎样定位一款「足够好」的人工智能产品,它的用户体验应该达到什么程度?

祝铭明回答,打造一款用户体验好的产品是一件不容易的事情,其中涉及大量的工作,而 Rokid 着重做的事情主要有以下几件:第一,客观的认识当前技术的边界,清楚认识 AI 当前能力的边界,包括产业、研究、工程、生产上的边界。第二,尽量让用户形成相应的产品使用习惯。第三,AI 产品,尤其是电子消费类产品,主要由软件、硬件、内容、后端服务等方面组成,每项技术与硬件之间都要在算法上进行调和,因为,我们要做的是将算法调优,将边界点调到最低

如果说,Rokid 的第一代产品 Rokid.Allien 是一款主打极客市场的产品,那么,第二代的 Rokid.Pebble 则是 Rokid 拓展消费市场的象征。祝铭明认为,这两类产品所面向的两类消费群体,极客与大众,其关键差异在于这两类消费群体对智能的敏感程度,对于 AI 和产品的理解,早期用户和客户都已经形成了一定的认识,而新用户额理解还存在一定的偏差。

关于 AI 产品如何卖的问题,在访谈中,祝铭明用了较大的篇幅,分享了 Rokid 团队近期组织他们的博士团,在奇客巴士蹲点卖货的所见所闻和感悟。值得欣喜的是,从这些线下零售店的销售数字来看,到目前为止,AI 产品(特指 AI 赋能后的消费硬件产品)的月平均销量,Rokid 是居于榜首的

在与大量真实用户的面对面交流中,Rokid 发现,要想增加销量和刺激用户购买,最好的方式就是让用户直接摸到、听到、感受到。Rokid 产品的线下转化率高达 10%,也就是 100 个人停下来看产品,有 10 个人买单。而相比 3~5‰ 的新品类线上销售转化率,Rokid 感受到了这个品类(特指像 Rokid 一样的智能新生命,或者可以通俗的理解为智能语音终端)的市场,虽然不至于成为所谓的超级爆品,但「比大家想象的要乐观」,只是还需要一点耐心。

思必驰 赵恒艺:语音开放平台之战打响,用对话定制 DUI 平台「赋能」万物 AI

基于人机对话交互模式的智能音箱成为了行业的热点,已有大量的语音平台技术厂商与其合作伙伴都做了类似的产品布局。据不完全统计,行业内已有 40 多个人机对话的平台。在启动 DUI 开放平台项目之前,思必驰副总裁赵恒艺就已经率领团队对国际和国内的相关领域进行全方位的调研,包括各个语音对话平台的优点和不足之处,以及相关开发者对平台的诉求。

思必驰的调研报告显示:有 67% 的开发者对这类语音开发平台持观望态度,部分(30%)不太了解技术的人认为平台不需要具备算法降噪、回声消除等功能。有 97% 的开发者希望语音开发平台能有自主定制权,差异化。

基于自身构建的框架基础,思必驰结合了不同客户、开发者的需求,力求做出拥有竞争优势、满足不同需求且能够定制化的 DUI 开放平台。思必驰打造的 DUI 开放平台提供了一整套完整的自主对话交互内核,开发者只需要做引擎和语义等相关的开发。DUI 开放平台以任务型对话为核心,重视落地应用体验。在支持 GUI 与 VUI 良好融合的同时,DUI 平台还支持高度的定制化,包括对话逻辑、技能服务等,开发者可针对特定场景进行特殊定制。 另外,DUI 还能实现本地和云端双重技能的定制,让设备在没有联网的情况下能执行用户使用频率相对较高的任务,如车载场景下的导航等。DUI 可视化的编辑界面,提供了文字、列表、图文卡片、音乐播放、内嵌网页等可视化组件,使得非专业的开发者能快速上手。为了便于开发者的运营,DUI 还提供一套可呈现实时运维数据的系统,实时了解用户活跃度、使用时长等平台相关维度信息。

作为「赋能」者,思必驰已将 DUI 开放平台作为公司的重要战略任务之一,与众多的合作伙伴、开发者共同打磨、完善产品。为此,思必驰还专门设立了 2 亿元的基金,用于鼓励平台开发者。

富士康 李国瑜:不仅是制造王国,还要成为 AI 硬件赋能的生态航母

大众认知下的富士康是制造业巨头,是电子产品的代工帝国,是遍布全中国乃至全世界的厂房和 120 万的流水线工人。在人工智能浪潮的冲击下,富士康积极地寻求着转变,依靠自身强大的制造能力和技术优势,开始向「AI 的硬件赋能者」转型。

演讲开始,富士康科技集团副总经理李国瑜女士首先向观众展示了一个富士康作为「制造王国」的实力:从最早的 iPod,到 iPhone、iMac,再到 iPad、 HomePod,富士康几乎承包了苹果的整条产品线。经过多年与苹果、亚马逊及一些世界顶级 3C 品牌厂商的合作与磨合,富士康的制造水准已经代表了当今制造业的最高水平。

然后,本次峰会,富士康的团队走到台前,最重要的使命就是向业界展示富士康「创新」的力量。富士康将在中国大陆事业的起点——富士康在深圳的第一栋厂房,交给了去年收购的夏普白色家电团队,作为事业的新起点,并将那里改造成为夏普全球智能家电产品研发设计中心,全力进军创新产业,重新设计和定义了夏普的智能家居产品。

在谈及智能语音是否是下一个人机交互入口时,富士康认为,语音+屏幕才会是未来的主流,未来硬件的智能化,应该是能够拥有集视觉与听觉于一体的立体感知系统。结合夏普最核心的屏幕产品,富士康将其智能产品的研发基础定位于「平板+」,基于触屏体验为出发点,富士康重新打造了夏普空气清新器、智能冰箱等一系列产品。而其中最为核心的,则是一款完全原创、具有音屏的智能互动能力的家庭智能管家「晓乐」

与此同时,富士康还联合智能语音企业 思必驰三角兽 推出了名为「大伙儿」的声屏交互体验生态系统。该平台融声屏开发技术创新孵化与开放式营销平台于一体,对智能硬件进行表情加声纹的双重定制,提高硬件的智能度。

富士康将打造一条「从产品到平台思维的软硬整合商运模式的价值生态链」,同时也将是一艘能广纳软硬技术行业各路英豪的巨型商业航母,从硬件整合、软件整合、数据融合、服务接入四个部分,实现复杂的跨领域跨学科资源整合。

最后, 李国瑜女士表示:「AI 赋能硬件,硬件实现 AI,富士康所代表的深入的硬件的设计能力,以及软硬整合的能力,就像是这艘生态航母上的军火,助力大家走向更远更美好的未来。」

DeepBrain 李传丰:离语音交互 OS 真正成熟,至少还需要 5~10 年,而作为创业公司,我们专注于语义技能

由于支持语言的限制(目前 Alexa 仅支持英德两种语音,传言年内进入印度市场),Alexa 开放生态体系虽然强大,但尚不能覆盖到中国本土用户。

作为国内语音智能行业的先行者,DeepBrain 核心团队是国内最早专注于自然语言处理技术(NLP)领域的团队之一,曾在 2011 年苹果发布集成了 Siri 智能语音助手后,推出过国内第一款基于智能手机的中文语音助手——智能 360,并积累了千万级的用户。重组后的团队在 2014 年还做出了国内第一款语音智能音箱小智超级音箱,比 Echo 的推出还要早半年。

经过长时间的准备,DeepBrain 于 2017 年 5 月推出了 DeepBrain AI 云平台,并在国内率先推出了中文语义技能商店,「这或许是语义为中心的生态计划中最关键的一环」,DeepBrain 李传丰强调。

深圳湾曾在之前与 DeepBrain 有过深入的访谈和交流,并率先在国内对「技能市场」进行深度解读。在本次峰会上,李传丰对语音智能未来市场进行了预测:「未来基于语音交互的语义技能,其数量应该达到上百万种,语音交互 OS 才能真正成熟。」鉴于 Alexa 技能商店目前的数量为 15000 个,要达到这个成熟市场的状态,「在我看来,至少还需要 5~10 年。」DeepBrain 目前已经上线的语义技能超过了 1000 种,以音频与儿童教育为主。

在经历了很多年的研发积淀之后,DeepBrain 已经拥有了语义技能商店、AI 人机对话引擎、机器人功能组件、精细化大数据及家居互联网服务等五大核心能力。与行业解决方案公司不同的是,DeepBrain 愿意和更多做语音识别的公司形成战略合作关系,而自己专注于做语义技能平台

Sugr 米唐科技 宋少鹏:Alexa 认证的不是技术方案,而是用户体验

米唐科技作为亚马逊认证的 Alexa 系统解决方案提供商、全球合作伙伴,腾讯语音服务首批战略合作伙伴,提供从 PTT 按键交互到远场语音交互的完整解决方案,帮助行业快速开发和量产 Alexa 兼容产品,构筑语音交互生态。

Sugr 米唐科技创始人兼 CEO 宋少鹏在消费电子和音频信号处理行业 14 年,在看到 2014 年亚马逊推出了 Echo 和 Alexa 后,他坚定的认为,语音交互是未来的方向,而智能音箱只是语音交互落地的第一代产品,如同亚马逊推出 Echo 只是作为 Alexa 的一个参考设计一样,未来语音交互产品的形态将越来越丰富。而基于亚马逊的内容和电商平台,智能音箱不只是一个消费级的硬件产品,智能音箱更重要的使命是承载第三方服务。亚马逊的数据显示,用户使用最多的语音服务,第一是音乐,第二是新闻,第三是闹钟和提醒。用户对于这类音箱的需求,已经不仅仅是听音乐的需求,智能音箱已经开始成为他们生活的一部分。

在 4 月 15 日举办的「WARE 2017 语音智能平台与应用峰会 第 I 季」的活动上,深圳湾邀请到了 Alexa 资深架构师做分享,现场与会者有不少是在海外市场发力 Alexa+ 的设备厂商,他们都向深圳湾表达了在 Alexa 认证方面遇到的问题。

关于和亚马逊 Alexa 的合作以及认证问题,宋少鹏的经验是:「亚马逊认证的不是一个技术方案,也不是单一的产品,亚马逊认证的是一个用户体验。它会从头到尾地检测你的产品,从开箱体验、配置网络、声效、光效、等等。」鉴于此,宋少鹏强调,Sugr 是一家注重用户体验的公司,Sugr 交付的不仅仅是产品,更是完整的用户体验。Sugr 团队中有交付设计师,有设计师的方案团队,以帮助客户完善产品体验,响应亚马逊对于用户体验的高要求。

哈曼 宋柏勋:为语音智能系统打造专门的「耳朵」和「嘴巴」

今年 5 月微软发布了与三星全资子公司哈曼合作、内置微软 Cortana 语音助理与 Skype 电话服务的智能音箱 Invoke。当时,参加了「WARE 2017 语音智能平台与应用峰会 第 I 季」活动的哈曼麦克风系统负责人宋柏勋告诉深圳湾,Invoke 背后的远场语音技术是由哈曼的嵌入式音响事业部提供的。很快,在 6 月初的 CES Asia 上,哈曼举行了语音识别解决方案 SONIQUE 的发布会

站在「WARE 2017」舞台上的哈曼麦克风系统负责人宋柏勋,掩饰不住从台下听课到台上分享的喜悦,在致谢了深圳湾能够挖掘社区资源并回馈滋养社区后,他用了较快的语速,一股脑的向与会者分享了哈曼在语音交互和语音智能系统的经验。

宋柏勋从如何让人机语音交互更自然的角度,谈了现有的语音交互技术在实现从技术到感性的跨越时,还需要哪些方面的努力。

宋柏勋首先谈到,相比其他交互方式,语音输入更加方便,沟通简易。但对比人与人的对话,人机语音沟通还是有很多差异点。例如声音的清晰程度和识别率,对对话内容的专注程度,语气中的情绪倾向,对话对象的可控性等等。

同时,在声音的接收和识别方式上,机器和人耳的工作机制也有很大的差异。人能够仅通过两只耳朵十分精确的判断音源位置,这与人的耳道以及神经系统对声音信息的处理方式密切相关。理解并学习人耳对声音的处理方式,也是语音识别相关研究一个重要方向。

在语音智能领域,在声音的处理上拥有丰富经验的哈曼,专注于为语音智能系统打造足够的聪明的「耳朵」和「嘴巴」。一方面,哈曼提供高精度的麦克风单元和麦克风阵列,另一方面,哈曼也专门设计了应用于语音产品的低失真喇叭,二者可以组合适用于各种场景的多种方案,为语音智能系统高质量地解决前端输入和末端输出的问题。

VINCI 朱大卫:在 On The Go 的移动场景下,语音对话式交互,才是耳机未来的交互方式

2015 年,朱大卫和他的 VINCI 智能头机首次在大众视野里亮相,这台顶着一块彩色屏幕、几乎违背了人们对耳机的所有基本认知的头戴产品被业界和消费者吐槽得很惨。尽管朱大卫一直试图强调,VINCI 的头机是跟耳机不在同一维度的全新品类,但在面世之初,像是语音控制、AI 情景匹配之类的卖点并没有引起人们的兴趣,大家的注意力都放在了这块看起来功能鸡肋又羞耻感爆表的屏幕上,突破常理的大胆设计成了 VINCI 的「原罪」。

这个「原罪」背后的「始作俑者」,就是 VINCE 的创始人朱大卫,也正是这样一个颇有争议的人物,受深圳湾的邀请,面对满堂的业界资深人士,分享垂直场景的全栈式 AI 创新。

2014年,我在查尔斯河旁边跑步的时候,发现大部分人戴着 iPhone 和有线耳机跑步,这个场景下,人本身还是需要和信息连接的,但是解决的办法非常奇怪。如何让 On The Go 场景中的人与信息连接的更紧密?便成了日后我的创业课题。

朱大卫很早就开始思考移动场景的产品变革。过去的听歌体验其核心是手动式交互,而 VINCI 智能头机的核心功能是语音对话式交互。这个产品背后的逻辑是非常简单的,语音仍是移动场景下最合适的交互方式,现在的语音技术也能够解决大概 80% 的日常交互需求,但在语音交互受限时仍需要一套弥补方案,在考虑了诸多交互设计之后,VINCI 最终还是选择了触摸屏。

关于声+屏的产品形态,朱大卫的观点是:「以智能音箱为代表的语音交互界面(VUI)和以智能手机屏幕为代表的图形交互界面(GUI)之间并不是替代关系,VUI 是另外一种东西,这上面的许多服务是还未被发掘的、只能存在在 VUI 上的。」

LifeSmart 董熠:未来的房子是一个有自主意识的机器人,在家庭场景下打造产品,让 AI 无所不在

作为国内最早的一批智能家居创业企业之一,LifeSmart 经历过一波智能家居的热潮,以及一波「伪」智能家居的退潮。让用户回家之后掏出手机、打开 APP 的「伪」智能家居产品,其诟病也让这个行业对智能家居的信心有了不同程度的损伤。

如今,LifeSmart 的产品形态早已超越智能家居套件,在董熠看来,未来房子就是一个有自主意识的机器人。内置很多传感器来了解人的行为和数据,有很多执行部件像四肢一样控制家挺,有 AI 在云上调度数据和信息。这样才能达到完全自动控制的境界。

面对着智能音箱的火爆,LifeSmart 曾经也想开发一款用语音控制的音箱,但后来放弃了,董熠的理解是:语音在家庭环境中应该是无处不在的,可以让人变得很自由,在任何时候都可以坐在那里跟房子对话,基于用户的位置、数据、声音,给出合适的反馈,最终实现在家庭场景下人工智能的无所不在。

人工智能有一个分布式的部署架构,语音也是如此。不光是连接到云端的时候,智能设备具有深度学习的能力,在本地的时候,要有离线技术的支持。董熠说:「人工智能应该在云端和本地同时部署,当网络断开的时候,仍然可以完成很多智能化的功能。当连到云端的时候,这个时候再具有一种深度学习的能力,这是我们对于未来家庭的理解。」

未来的家庭应该是逐步变成一种有意识的形态,LifeSmart 也是基于这样的理解,努力让家变得有「意识」

狗尾草 邱楠:二次元老兵在聊天机器人上的探索

本次「WARE 2017」的语音智能峰会,我们试图从不同场景去探索语音智能的产品形态。教育场景、家居场景、移动场景、移动场景、办公场景...... 这些是语音技术应用最广泛的几个场景。但除此之外,还有新的可能。

狗尾草智能科技(GoWild)已出品多款公子小白智能语音交互机器人,并在消费市场上表现出不俗的成绩。去年,狗尾草推出了 Holoera 琥珀·虚颜 AI 3D 全息主机,突破性的将语音技术应用在二次元领域。琥珀·虚颜是一款拥有人工智能的虚拟艺人,主要「生活」在全息 3D 主机 Holoera 中。

该公司的 CEO 邱楠是个不折不扣的二次元老兵,但是他并不希望外界将琥珀当作简单的全息投影玩具,而是一个会聊天有情感的虚拟生命。

邱楠认为,一款聊天机器人要称为强人工智能的杀手级应用,还需要面对不少的挑战。一是,多轮对话的处理;二是,对话场景从垂直领域扩散到开发领域的困难;三是,上下文的结合;四是,识别用户多样化的表达和意图;五是,个性化的对答;最后,还要在对话中体现机器人的情感。

为此,开发者需要基于大数据来构建海量的知识图谱,并在此基础上,重点实现语义理解、知识表示、QA、智能对答和用户建模等 5 个技术的落地。

另外,邱楠认为,我们接触世界的手段不仅仅是文字,而是结合图像、语音和文字等多模态来了解外部世界的。因此,我们所构建的知识图谱也应该从单纯的文本扩展到多媒体知识图谱,而 ImageNet 和 Visual Genome 正在往这方面努力。

百「箱」争鸣 | 灵隆科技魏强、猫王曾德钧、超声刘晓彤,智能音箱探索者「风口」上的思考  

在 WARE 2017 语音智能峰会的最后压轴环节,我们邀请了灵隆科技总经理魏强、猫王创始人曾德钧、超声(TYMPHANY)音响总经理刘晓彤,共同分析国内音箱行业现状,探讨未来音箱创业的风口。

魏强,现任京东和科大讯飞合资公司北京灵隆科技有限公司总经理。叮咚音箱的语音交互系统由科大讯飞开发,渠道则由京东负责。从 2015 年 8 月起,已推出 6 款智能音箱,领跑其他智能音箱企业。从叮咚音箱概念诞生、产品设计、生产制造以及市场销售的整个过程,魏强一路趟过了不少坑。而叮咚音箱也几乎成为业界示范性的产品——几乎每一个启动智能音箱项目的团队,都有拆解过叮咚音箱。

在世界范围内,几乎所有的大厂商都在做智能音箱,这是一个很明显的信号,智能语音产品很可能会成为下一代交互入口。而国内很多公司其实并没有想清楚智能音箱火起来靠的是哪股风,就一窝蜂全涌上来做产品,争抢市场,这并不见得是好事。「我们不希望大家一窝蜂上,去做低水平的重复性投入,每家公司应该找恰当的点切入特定的应用场景可能会更合适,而不是毫无目的的涌入。」

作为「猫王」复古收音机品牌的缔造者,曾德钧还有一个更为大众所了解的抬头「猫王之父」,自 2015 年创立品牌以来,累计销量突破 50 万台。

作为在音响行业混迹几十年的老兵,深谙这一片蓝海要打出一片新品牌之难,因此他选择了并不智能的蓝牙音箱作为创业方向。面对「百箱大战」的行业「风口」,曾德钧十分冷静的并没有跟风,而是把精力放在最有效的地方,把产品和品牌做好。同时,他还把自己当初帮助灵隆科技研发智能音箱的经验,无条件的传授给了有需要的人。此外,他还向百度度秘推荐了自己的设计合作伙伴,共同设计了百度 DuerOS 的参考设计音箱。

刘晓彤,惠州超声音响总经理、深圳市音响行业协会会长、中国电子音响工业协会专家组成员。在音响 ODM 行业浸淫近 30 年的行业前辈。超声(TYMPHANY)是几乎所有国际大牌音响品牌背后的 ODM 厂商,和所有基本上你能想到的品牌都有过紧密的合作。

作为行业领军企业之一,超声音响在智能音箱项目上,近几年持续的投入了很大的人力、物力,在新技术、新方案上进行预研,同时在传统优势—声学研发上,持续加大投入进行配合。就在 WARE 大会召开前的半个月,刘晓彤向深圳湾透露,公司在智能音箱上的业务收入,只占全部代工业务的 1%。时隔半个月,超声又因为一笔大生意,而让这个收入比例,上升至 10% 以上。踩准点,早投入,这或许是超声为国内传统音响 ODM 厂商在转型过程中的最宝贵经验。

对于希望希望进入智能音箱领域的传统音响行业人士,刘晓彤对他们的建议是:「如果有能力走在前面,那就去尝试;如果现在还没有迈进去,不如等一等,等像百度这样的公司把平台做好,借平台之力完成产品从不智到智能的转型。」

展览展示 | 语音智能生态的繁荣,离不开软硬件平台与应用的极大丰富

在主会场之外,各大参展商的展台从中午 12 点开始,一直热热闹闹到晚上 7 点才散场。应上下游厂商的需要,配合峰会而开展的「语音智能平台与应用创新展」聚合了 AI 设备及应用、AI 平台及方案,以及 AI 生态及周边展示。旨在推动人工智能与硬件创新生态的融合,让机器赋能。

参展企业包括:富士康科技集团、DeepBrain、图灵机器人、Sugr 米唐科技、RAK 瑞科慧联、希巨科技、爱普泰科、云之讯、灵隆科技、疯童科技、云动创响、VINCI 玩起。

富士康收购夏普后,重新设计的智能空气净化器。富士康不仅把这款企业内的创新产品带到了「WARE 2017」大会的现场,还特别赞助了 10 台空净到大会主会场,为已经座无虚席的主会场空间,解决「空气污染」问题。在现场实测汇总,这款空净从最初的警示红灯,逐渐变成了代表健康空气的绿色灯。

RAK Wireless 在本次展会展出内嵌 AmazonAlexa AVS 的开源硬件套件 WisCore,帮助产品开发者快速构建支持 Amazon Alexa 的产品。

能够为智能音箱快速搭建通信能力的云之讯也吸引了不少开发者。

梧桐 CEO 早茶会 | 精致活动主题,精准商务社交

值得记录的精彩瞬间还有在会议当天上午开展的精致主题私享会。「梧桐 CEO 早茶会」本是深圳湾联合泰华梧桐岛在 2016 年联合开展的高端社交活动,已经连续举办过 4 场颇受好评的活动。借「WARE 2017」的活动,我们将与会的嘉宾邀请到了这个早茶会。

品味过美味茶点之后,我们精选了 30 多个语音智能领域的新闻事件,与嘉宾席地而坐,一起畅聊新闻背后的故事。透过这些新闻事件,大家增进了彼此的了解和认识。

尾声 | 特别感谢

特别感谢,富士康 B 次集团的团队,你们的敬业热情与专业精神,打动了到场的每一位与会者。感谢你们为会场带来的新鲜气息和创新力量。

特别感谢,美丽的生态办公园区,泰华·梧桐岛,你们对于产品的专注和用户体验的关注,另每一位来到梧桐岛的人,都被这里的美丽所感动。  

深圳湾的精彩,我们下一季「WARE 2017」再见!

Back to top btn