Uploads%2farticles%2f12282%2fware 2018      .063
|
2018-04-25

图灵郭家:儿童 AI 玩具自带人格属性,AI+IP 是儿童产品的一个大趋势

图灵机器人是一家聚焦人工智能语义的 AI 服务平台,自 2010 年成立至今,已在全球聚集了近 70 万名注册开发者,合作伙伴包括三星、微软、腾讯、百度、联想、海尔、HTC、小米等大牌厂商。而在不久前更是全面接入小爱同学,开始发力儿童 AI 语音技能。

在本次「深圳湾 WARE 2018 新硬件峰会」上,图灵机器人联合创始人郭家发表了他对于 AI 技术应该如何更好的应用于儿童领域的看法。

他认为,AI+IP 已是国际上儿童产品的一个大趋势,而要实现 AI+IP 的完美融合,首先应该聚焦把技术融合在构建影响力层面,从而实现吸引更多粉丝购买。

那么图灵如何将 AI 能力变现为智能服务呢?主要分为三个方面:一是在图灵语料总库的基础上,为每个机器人建立一个独立的记忆系统,让机器人学习并记忆每个用户个性化的习惯数据,这样会就有更深的粘性;二是为优质的合作伙伴定制特有资源的 AI 技能、知识图谱三是根据不同 IP 的内容剧本,训练出每个 IP 独有的话题。

以下内容为郭家在深圳湾「WARE 2018 新硬件峰会上」的演讲实录,在不改变愿意的基础上略有删减:

嘉宾:图灵机器人联合创始人 郭家

主题:AI+IP:儿童智能产品的 AI 交互模型

大家好,我是图灵的郭家。今天跟大家分享一下 AI 在儿童领域的应用探索。

几天前,艾瑞咨询发布了一份 AI 领域的分析报告,分别从横向几个维度和纵向几个维度解析了人工智能产业:

横向维度包括基础设施(如芯片、传感器、数据)、行业应用场景(如工业、金融、教育)等,纵向维度则是按照技术归类划分,我们最终发现其实每个产品都可归类于这三大类技术:语音辨识与合成(ASR/TTS)、语义理解(NLP)、机器视觉(CV)等,这也是目前人工智能领域主要的三大主流技术框架。

(图)

图灵主要是做智能语义这个细分技术的,我也非常认可曾老师刚才的观点,一个产品好必须要名字好,「图灵」是我们比较早注册的一个名字, 2010 年公司开始探索 AI 方向时就把这个名字注册下来,当时人工智能领域还没有今天这么大的热潮。

我们从开放语义技术到现在,已经在全球积累了 70 多万开发者,每天还有很多开发者和企业应用我们的语义平台。自 2015 年开始,我们的儿童领域逐步跟 TOP 10 的企业达成合作,这里面有一些是儿童领域的,有一些是非儿童领域的,我就不一一列举了。

(图)

在语音语义交互领域有哪些关键的指标和构成呢?这是图灵的一些关键数据(见PPT),左边是我们最看重的算法类指标,包括语音、语义的交互数据,包括分词、意图解析 、NER 准确率等,标黄的部分则是客户及用户层面也非常关注的数据。

(图)

比如说响应速度,我记得在跟富士康合作的过程中,有幸看了一下 Echo 的交互数据,从用户说话到反馈结果,平均耗时 1.5 秒。我们测了很多国内的产品,有的比它还要更快,这是特别重要的一个指标。还有一个指标,我们问一个问题,机器能不能回答好,包括两部分:第一部分是正确的理解、听懂你的意思;第二部分是找到合适的答案给到你。所以意图理解是非常重要的环节,也是各项国际赛事主要 PK 的指标。

我们常讲 AI 的技术的本质是算法+数据,数据的积累往往是一个公司的门槛。我特别认可一句话,所有的互联网公司都会变成数据公司,所有的数据公司都会变成人工智能公司,所以数据对大家至关重要。图灵还为儿童提供儿童音视频资源和成人音视频资源。

小米 3 月 15 日发布会当天起,我们和小米儿童产品全面合作,在小米智能手表、故事机上面采用了图灵的 AI 技术。而在 3 月 27 日小米发布会上,雷军宣布小爱同学不仅植入了电视,还植入了手机,我们图灵也进入到里面的儿童对话部分。

图灵的 AI 技术包括三大方面的能力,一个是语音对话,包括闲聊型、知识问答型和技能任务;第二是儿童内容点播;第三是家长端。相信在座的各位比较熟悉,这也不是今天要跟大家讨论的重点,重点是另外一部分是 AI+IP 部分。

(图)

首先看这个数据,白色的这款是 MIT 著名的 Jibo 产品,也是几个教授一起做的一款产品,它的销量比起超级飞侠的销量,以及用户的喜爱度还是差很远。其实,对儿童来说,喜欢哪个不喜欢哪个,从外观和表现力上就已经非常明显。

这是图灵的 AI+IP 的模型。首先我们看 IP 的价值是什么:首先要有足够的流量建立影响力,比如明星,我就要拉着他经常走秀,让他出名;然后接一些广告变现,进行粉丝消费变现,在动画领域的一些儿童 IP 已经有这样的价值了。

那怎么实现 AI 技术与 IP 的融合呢?首先从技术层面来讲,包括语音、视觉、机械控制等,其次还要做很多智能化的服务,才能让整个 AI 价值体现出来。

(图)

换一个维度来梳理框架,要把 AI 叠加在 IP 上面,就应该是把技术融合在构建影响力这个层面,去吸引足够多的粉丝,然后把智能化的服务和消费在上面,这是我们主要思考的 AI+IP 的模型。在这个模型下,我们来看一下都包含哪些东西:

首先,多模态交互。我们给客户定制的个性化多模态交互包含四大部分的功能:第一,属性个性化,定义机器人的姓名、年龄、性别、父母等等;第二,音色个性化,用 WaveNet 生成语音 TTS 模型第三,动作个性化,比如小时候看『圣斗士星矢』,每个角色都有标志性的动作,包括现在的动画片,标志性动作都非常重要;第四,表情个性化,每个角色交流过程中不仅有动作、声音,还有丰富的表情,这是通过精准计算后得出的情感程度、情感类型而展现出来的。

给大家展示一下几种 TTS 的效果。(播放音频)这是目前市场上主流的 TTS 技术。但是今年一月份发生了一件事情 ,AlphaGo 团队开放了一个最新的 TTS 技术—— 基于 WaveNet 卷积神经网络的 Cloud TTS,发布之后我们试了一下,几乎秒杀 BAT 和讯飞的 TTS 的效果,给大家听一下最新的效果(播放音频)。

不难发现 ,Google TTS 的音色的圆润程度远远比市场现有 TTS 音色的圆润程度高,能做到和人物原声相似度达 95% 以上。甚至还有一些客户找到我们,让我们帮助做电话销售的 TTS,就是当你接起电话,那边与你讲话的就是合成的声音 。Google 的技术确实非常好,能够比我们国内研发迭代的速度更快一些。

清华大学 Aminer 团队不久前发布了一份报告,报告显示图灵儿童 AI 专利数为同类专利总数的 62%,多模态交互专利全球第二 ,AI 专利总数则是全球第四。

(图)

接下来讲一下智能化服务,也就是我们的 AI+ IP 模型怎么变现。分三方面:

第一,建立独立记忆系统。这个需要海量的数据来做,例如如果能持续记录用户的个人习惯,并做出相应的个性化调整,这能使得产品有更深的粘性。

第二,定制语义技能。因为我们一直也是开发者,所以为优质合作伙伴定制自有资源的 AI 技能、知识图谱等。

第三,剧本式话题,根据动画片的剧本,生成每个 IP 独有的话题。比如说我们跟小猪佩奇合作,跟超级飞侠蒙奇小队(音)合作,我们训练出来的内容跟其他内容就不一样。比如我问它,你有去过巴黎吗?如果小猪佩奇就会说,法国就在我们隔壁,我经常去;如果是超级飞侠就会说,我本来就会飞,想去哪里就去哪里。

响应客户的需求,我们做了大量儿童类的教育工作,我们把一些课本教材拿过来作为资源。

(图)

AI+IP 也是国际上儿童产品的趋势。如图,图一是我们图灵和日本夏普合作的 RoBoHoN 机器人;图二是会说话的超级蜘蛛侠;图三是迪斯尼申请的的 AI 剧本专利,就是把故事给儿童 AI 训练学习,这也是儿童领域的大方向。

作为一个机器人,它所体现出来的玩点,对儿童的吸引点究竟在哪儿呢?我们找了世界各地的小朋友做了一次调研。第一张图中是墨西哥的一个小朋友,他最喜欢小汽车。第二个是意大利的小朋友,喜欢各种公主裙和芭比娃娃。第三个喜欢飞机。第四个中国小朋友喜欢枪和炮。

小朋友喜欢玩什么?答案很明确,就是给他一个能承载梦想的实体。比如说,第一个是驾驶员的梦想,我小时候玩小汽车就有在驾驶的感觉;第二个是公主梦;第三个是飞行员的梦想;第四个是当战士的梦想。

我们可以这样来设想,儿童眼中梦想的机器人应该是什么样子?他们极具想象力,你给他一个简单的玩具,他就能设想出一个完美的梦想。例如图中在我们看来就是一个简单的帐篷,但在孩子们的眼中它可能是一座城堡。

(图)

AI 机器人天然自带一种人格属性,它就是一个有生命的机器人,而多模态交互能让 IP 角色更加丰富,这样就能够更加满足他的梦想。同时我们再在其中加入智能化的内容服务,就可以帮助孩子产生对学习的乐趣。

以上就是我的分享,谢谢各位!

>>
Back to top btn