图灵郭家：儿童 AI 玩具自带人格属性，AI+IP 是儿童产品的一个大趋势

Uploads%2farticles%2f12282%2fware 2018 .063

2018-04-25

图灵机器人是一家聚焦人工智能语义的 AI 服务平台，自 2010 年成立至今，已在全球聚集了近 70 万名注册开发者，合作伙伴包括三星、微软、腾讯、百度、联想、海尔、HTC、小米等大牌厂商。而在不久前更是全面接入小爱同学，开始发力儿童 AI 语音技能。

在本次「深圳湾 WARE 2018 新硬件峰会」上，图灵机器人联合创始人郭家发表了他对于 AI 技术应该如何更好的应用于儿童领域的看法。

他认为，AI+IP 已是国际上儿童产品的一个大趋势，而要实现 AI+IP 的完美融合，首先应该聚焦把技术融合在构建影响力层面，从而实现吸引更多粉丝购买。

那么图灵如何将 AI 能力变现为智能服务呢？主要分为三个方面：一是在图灵语料总库的基础上，为每个机器人建立一个独立的记忆系统，让机器人学习并记忆每个用户个性化的习惯数据，这样会就有更深的粘性；二是为优质的合作伙伴定制特有资源的 AI 技能、知识图谱；三是根据不同 IP 的内容剧本，训练出每个 IP 独有的话题。

以下内容为郭家在深圳湾「WARE 2018 新硬件峰会上」的演讲实录，在不改变愿意的基础上略有删减：

嘉宾：图灵机器人联合创始人郭家

主题：AI+IP：儿童智能产品的 AI 交互模型

大家好，我是图灵的郭家。今天跟大家分享一下 AI 在儿童领域的应用探索。

几天前，艾瑞咨询发布了一份 AI 领域的分析报告，分别从横向几个维度和纵向几个维度解析了人工智能产业：

横向维度包括基础设施（如芯片、传感器、数据）、行业应用场景（如工业、金融、教育）等，纵向维度则是按照技术归类划分，我们最终发现其实每个产品都可归类于这三大类技术：语音辨识与合成（ASR/TTS）、语义理解（NLP）、机器视觉（CV）等，这也是目前人工智能领域主要的三大主流技术框架。

（图）

图灵主要是做智能语义这个细分技术的，我也非常认可曾老师刚才的观点，一个产品好必须要名字好，「图灵」是我们比较早注册的一个名字， 2010 年公司开始探索 AI 方向时就把这个名字注册下来，当时人工智能领域还没有今天这么大的热潮。

我们从开放语义技术到现在，已经在全球积累了 70 多万开发者，每天还有很多开发者和企业应用我们的语义平台。自 2015 年开始，我们的儿童领域逐步跟 TOP 10 的企业达成合作，这里面有一些是儿童领域的，有一些是非儿童领域的，我就不一一列举了。

（图）

在语音语义交互领域有哪些关键的指标和构成呢？这是图灵的一些关键数据（见PPT），左边是我们最看重的算法类指标，包括语音、语义的交互数据，包括分词、意图解析、NER 准确率等，标黄的部分则是客户及用户层面也非常关注的数据。

（图）

比如说响应速度，我记得在跟富士康合作的过程中，有幸看了一下 Echo 的交互数据，从用户说话到反馈结果，平均耗时 1.5 秒。我们测了很多国内的产品，有的比它还要更快，这是特别重要的一个指标。还有一个指标，我们问一个问题，机器能不能回答好，包括两部分：第一部分是正确的理解、听懂你的意思；第二部分是找到合适的答案给到你。所以意图理解是非常重要的环节，也是各项国际赛事主要 PK 的指标。

我们常讲 AI 的技术的本质是算法+数据，数据的积累往往是一个公司的门槛。我特别认可一句话，所有的互联网公司都会变成数据公司，所有的数据公司都会变成人工智能公司，所以数据对大家至关重要。图灵还为儿童提供儿童音视频资源和成人音视频资源。

小米 3 月 15 日发布会当天起，我们和小米儿童产品全面合作，在小米智能手表、故事机上面采用了图灵的 AI 技术。而在 3 月 27 日小米发布会上，雷军宣布小爱同学不仅植入了电视，还植入了手机，我们图灵也进入到里面的儿童对话部分。

图灵的 AI 技术包括三大方面的能力，一个是语音对话，包括闲聊型、知识问答型和技能任务；第二是儿童内容点播；第三是家长端。相信在座的各位比较熟悉，这也不是今天要跟大家讨论的重点，重点是另外一部分是 AI+IP 部分。

（图）

首先看这个数据，白色的这款是 MIT 著名的 Jibo 产品，也是几个教授一起做的一款产品，它的销量比起超级飞侠的销量，以及用户的喜爱度还是差很远。其实，对儿童来说，喜欢哪个不喜欢哪个，从外观和表现力上就已经非常明显。

这是图灵的 AI+IP 的模型。首先我们看 IP 的价值是什么：首先要有足够的流量建立影响力，比如明星，我就要拉着他经常走秀，让他出名；然后接一些广告变现，进行粉丝消费变现，在动画领域的一些儿童 IP 已经有这样的价值了。

那怎么实现 AI 技术与 IP 的融合呢？首先从技术层面来讲，包括语音、视觉、机械控制等，其次还要做很多智能化的服务，才能让整个 AI 价值体现出来。

（图）

换一个维度来梳理框架，要把 AI 叠加在 IP 上面，就应该是把技术融合在构建影响力这个层面，去吸引足够多的粉丝，然后把智能化的服务和消费在上面，这是我们主要思考的 AI+IP 的模型。在这个模型下，我们来看一下都包含哪些东西：

首先，多模态交互。我们给客户定制的个性化多模态交互包含四大部分的功能：第一，属性个性化，定义机器人的姓名、年龄、性别、父母等等；第二，音色个性化，用 WaveNet 生成语音 TTS 模型；第三，动作个性化，比如小时候看『圣斗士星矢』，每个角色都有标志性的动作，包括现在的动画片，标志性动作都非常重要；第四，表情个性化，每个角色交流过程中不仅有动作、声音，还有丰富的表情，这是通过精准计算后得出的情感程度、情感类型而展现出来的。

给大家展示一下几种 TTS 的效果。（播放音频）这是目前市场上主流的 TTS 技术。但是今年一月份发生了一件事情，AlphaGo 团队开放了一个最新的 TTS 技术—— 基于 WaveNet 卷积神经网络的 Cloud TTS，发布之后我们试了一下，几乎秒杀 BAT 和讯飞的 TTS 的效果，给大家听一下最新的效果（播放音频）。

不难发现，Google TTS 的音色的圆润程度远远比市场现有 TTS 音色的圆润程度高，能做到和人物原声相似度达 95% 以上。甚至还有一些客户找到我们，让我们帮助做电话销售的 TTS，就是当你接起电话，那边与你讲话的就是合成的声音。Google 的技术确实非常好，能够比我们国内研发迭代的速度更快一些。

清华大学 Aminer 团队不久前发布了一份报告，报告显示图灵儿童 AI 专利数为同类专利总数的 62%，多模态交互专利全球第二，AI 专利总数则是全球第四。

（图）

接下来讲一下智能化服务，也就是我们的 AI+ IP 模型怎么变现。分三方面：

第一，建立独立记忆系统。这个需要海量的数据来做，例如如果能持续记录用户的个人习惯，并做出相应的个性化调整，这能使得产品有更深的粘性。

第二，定制语义技能。因为我们一直也是开发者，所以为优质合作伙伴定制自有资源的 AI 技能、知识图谱等。

第三，剧本式话题，根据动画片的剧本，生成每个 IP 独有的话题。比如说我们跟小猪佩奇合作，跟超级飞侠蒙奇小队（音）合作，我们训练出来的内容跟其他内容就不一样。比如我问它，你有去过巴黎吗？如果小猪佩奇就会说，法国就在我们隔壁，我经常去；如果是超级飞侠就会说，我本来就会飞，想去哪里就去哪里。

响应客户的需求，我们做了大量儿童类的教育工作，我们把一些课本教材拿过来作为资源。

（图）

AI+IP 也是国际上儿童产品的趋势。如图，图一是我们图灵和日本夏普合作的 RoBoHoN 机器人；图二是会说话的超级蜘蛛侠；图三是迪斯尼申请的的 AI 剧本专利，就是把故事给儿童 AI 训练学习，这也是儿童领域的大方向。

作为一个机器人，它所体现出来的玩点，对儿童的吸引点究竟在哪儿呢？我们找了世界各地的小朋友做了一次调研。第一张图中是墨西哥的一个小朋友，他最喜欢小汽车。第二个是意大利的小朋友，喜欢各种公主裙和芭比娃娃。第三个喜欢飞机。第四个中国小朋友喜欢枪和炮。

小朋友喜欢玩什么？答案很明确，就是给他一个能承载梦想的实体。比如说，第一个是驾驶员的梦想，我小时候玩小汽车就有在驾驶的感觉；第二个是公主梦；第三个是飞行员的梦想；第四个是当战士的梦想。

我们可以这样来设想，儿童眼中梦想的机器人应该是什么样子？他们极具想象力，你给他一个简单的玩具，他就能设想出一个完美的梦想。例如图中在我们看来就是一个简单的帐篷，但在孩子们的眼中它可能是一座城堡。

（图）

AI 机器人天然自带一种人格属性，它就是一个有生命的机器人，而多模态交互能让 IP 角色更加丰富，这样就能够更加满足他的梦想。同时我们再在其中加入智能化的内容服务，就可以帮助孩子产生对学习的乐趣。

以上就是我的分享，谢谢各位！

机器人

图灵

人工智能

儿童

深圳湾（微信公众号 ID：shenzhenware）是最早也是最活跃的硬件创新社区和媒体，关注「软件+硬件」带来的场景和交互创新，以及与平台和应用相连的产业链升级。

版权声明：本文系深圳湾原创，转载或摘录请先获得授权。
深圳湾微信公众号：shenzhenware。深圳湾同时在头条号、企鹅号、知乎等主流媒体站开设专栏板块，欢迎关注。转载、约稿、投稿、团队报道请在公众号对话框回复关键字并留下联系方式。

已经是最后一篇了, 去首页逛逛

已经是第一篇了去首页逛逛