Uploads%2farticles%2f12290%2fware      .017
|
2018-04-26

图灵郭家:如何打造儿童喜欢的智能产品?这个问题可以通过 AI+IP 模型来解答 | WARE 2018

成立 8 年,聚集 70 万应用开发者,聚焦儿童领域 AI 应用,图灵不仅仅是「阿兰·图灵」的那个图灵,图灵还是全球最大的中文语义技术公司,其 AI 技术已经帮助国内 TOP50 的儿童产品品牌实现了语音交互和智能化内容输出。

无论是图灵和日本夏普合作的 RoBoHoN 机器人、Sphero 新品,还是和电影『蜘蛛侠』一起上市的会说话的蜘蛛侠,以及迪斯尼 AI 剧本专利,我们都能发现,AI+IP 也是国际上儿童产品的趋势。

在深圳湾「WARE 2018 新硬件峰会」上,图灵机器人联合创始人郭家分享了图灵在儿童领域的 AI 应用探索和思考,并深入阐述了「AI+IP」模型如何帮助儿童智能产品实现影响力和智能化服务价值输出。

IP = 影响力(粉丝流量)+ 消费力(粉丝转化);AI = 多模态交互技术 + 智能化服务价值输出。

郭家和我们探讨了「儿童喜欢玩什么」的话题。同样都是机器人,无论是从销量还是用户的喜爱程度来看,Jibo 比起超级飞侠都差的很远。对于儿童来说,喜欢哪个不喜欢哪个,产品从外观和表现力上就已经非常明显了。

而在 AI 应用上,通用的 AI 是远远不够的,需要通过多模态人机交互,实现 IP 角色定制化,再依据 IP 角色定制内容输出。比如,当我问「你有去过巴黎吗?」,如果是小猪佩奇就会回答,「法国就在我们隔壁,我经常去」;如果是超级飞侠就会回答,「我本来就会飞,想去哪里就去哪里」。

AI 天然自带一种人格属性,它就是一个有生命的机器人。而多模态交互能让 IP 角色更加丰富,以满足儿童丰富多彩的梦想。在此基础之上,图灵再为产品加入智能化的内容和服务,就可以帮助儿童产生对学习更大的乐趣。

以下是郭家演讲实录,经深圳湾整理和发布。

---------------------------


演讲嘉宾:郭家 / 图灵机器人联合创始人

演讲主题:儿童智能产品的 IP 与 AI 交互

大家好,我是图灵的郭家。今天跟大家分享一下图灵 AI 在儿童领域的应用探索。

几天前,艾瑞咨询发布了一份 AI 领域的分析报告,分别从横向和纵向几个维度解析了人工智能产业:横向维度包括基础设施(如芯片、传感器、数据)、行业应用场景(如工业、金融、教育)等,纵向维度则是按照技术归类划分。

图灵从中发现,其实每个产品都可归类于这三大类技术:语音辨识与合成(ASR/TTS)、语义理解(NLP)、机器视觉(CV),这也是目前人工智能领域三大主流技术框架。

成立 8 年,聚集 70 万应用开发者,聚焦儿童领域 AI 应用,图灵不仅仅有一个好名字

「图灵」(阿兰.图灵)是鼎鼎大名的计算机之父、人工智能之父。「图灵」又是我们早在 2010 年公司开始探索 AI 方向时就注册的品牌名。我们在 AI 大潮袭来之前,就开始开发 AI 语音对话应用,那时候还是 App,之后又在业界率先推出了机器人操作系统。

图灵专注在 AI 语义技术开发多年,现在已经在全球积累了 70 多万开发者,这个数字每天都在增长和活跃。自 2015 年开始,图灵在儿童领域逐步与国内 TOP10 的企业达成合作,包括大家耳闻能详的步步高、火火兔、奥飞、读书郎、快易典、名校堂、KIDO 等。

图灵已经成长为全球最大的中文语义技术公司。

让儿童与机器的交互更自然,要看哪些关键指标?这里有图灵的一组研究

在语音语义交互领域有哪些关键的指标呢?这张幻灯片展示了图灵的研究成果。在众多指标里,ASR+NLP+TTS 速度、意图解析准确率、知识库、语料库,这些标注黄色的部分,是客户及用户层面非常关注的数据。

进一步阐释,这张图的左边是我们最看重的算法类指标,包括语音和语义的交互数据、分词准确率、意图解析准确率、NER 准确率等。

其中,在交互速度方面,拿 Echo 的语音交互数据做对比,从用户说话到 Echo 反馈结果,平均耗时 1.5 秒。我们也测了很多国内的产品,有的比 Echo 还要更快,这是特别重要的一个指标。

意图解析是指,当我们向机器问一个问题,机器能不能回答好,其中评价的指标包括两部分:第一部分是正确的理解、听懂你的意思;第二部分是找到合适的答案给到你。所以意图理解是非常重要的环节,也是各项 AI 国际赛事主要 PK 的指标。

AI 技术的本质是算法+数据,数据的积累往往可以成为一家公司的门槛。我特别认可这样的说法——所有的互联网公司都会变成数据公司,所有的数据公司都会变成人工智能公司。所以数据储备指标,对于语音交互的评估至关重要。为此,图灵也在积累儿童音视频资源。

三大技术能力,打造面向儿童硬件设备商的 AI 方案

前面有提到图灵已经和国内 TOP10 的企业达成合作,其中包括小米。今年 3 月,图灵和小米儿童产品已经全面展开合作,小米智能手表、故事机等小米生态链产品,都采用了图灵的 AI 技术。而在 3 月 27 日小米新品发布会上,雷军宣布小爱同学不仅被植入进了小米电视,还植入进了小米手机,而其中的儿童对话部分,就有图灵的技术支持。

图灵面向儿童硬件设备商的 AI 技术方案包括三大方面的能力:

  • 语音对话:闲聊型/知识问答型/技能任务型
  • 儿童内容点播:音乐/故事/教材/动画
  • 家长端:远程交互/设定提醒/数据管理

这些不仅仅是 PPT 的能力,更是图灵已经赋能 TOP50 儿童品牌后验证和训练出来的能力。

图灵的 AI+IP 模型:IP 建立影响力,AI 智能化服务输出价值

我们看这样一组数据:白色的这款是由 MIT 科学家们打造的明星产品 Jibo 家用社交机器人,红色的这款是奥飞旗下乐迪超级飞侠儿童机器人。目前,无论是从销量还是用户的喜爱程度来看,Jibo 比起超级飞侠都还是差的很远。这其中的原因不言而喻,对于儿童来说,喜欢哪个不喜欢哪个,从外观和表现力上就已经非常明显了。

图灵认为,IP = 影响力(粉丝流量) + 消费力(粉丝转化)。首先,要有足够的流量建立影响力,就像明星要经常走秀才能出名;然后,接广告变现,粉丝消费变现,在动画领域的一些儿童 IP 已经有这样的价值了。

图灵认为,AI = 多模态交互技术 + 智能化服务价值输出。AI 的价值体现,首先是在技术层面,产品层面实现了语音、视觉、机械控制等,其次在智能化层面,不断为用户输出内容和服务。

基于此,图灵构建了自己的 AI+IP 模型。

将 AI 与 IP 融合,把技术融合在构建影响力这个层面,去吸引足够多的粉丝,然后在消费力层间,持续的输出智能化服务的价值。

光有通用 AI 还不够,图灵通过多模态人机交互,实现 IP 角色定制化

图灵在对目标客户的研究发现,拥有 IP 的设备厂商,对于通用的 AI 并不感冒,他们往往都会有进一步的 IP 角色定制化需求。

图灵为客户定制的个性化多模态交互,包含四大部分的功能:IP 属性个性化、IP 音色个性化、IP 动作个性化、IP 表情个性化。展开来论述:

  • IP 属性:提供属性定义工具,定义机器人的姓名、年龄、性别、父母等
  • IP 音色:用 WaveNet 生成模型,做全球最好的 TTS 合成引擎
  • IP 动作:用语义串联动作,让机器人说什么话做什么动作
  • IP 表情:用情感计算识别的情感类型和程度,映射机器人的表情

目前市场上主流的 TTS 技术生成的童声,机器声音的痕迹还非常明显。今年年初,AlphaGo 团队开放了一个最新的 TTS 技术——基于 WaveNet 卷积神经网络的 Cloud TTS,我们在这一基础上进行了音色定制和优化,制作出来的童声,音色的圆润程度远远比市场现有 TTS 音色的圆润程度高,能做到和人物原声相似度达 95% 以上。(现场演示声音对比,秒杀效果令全场观众称赞。)

这里值得一提的是,清华大学 Aminer 团队不久前发布了一份报告,报告显示,图灵儿童 AI 专利数为同类专利总数的 62%,多模态交互专利全球第二,AI 专利总数则是全球第四。

光有单一的 IP 还不够,图灵帮助品牌方实现智能化的内容和服务价值输出

接下来讲一下 AI+IP 模型中的智能化服务,分三方面阐述:

第一,建立独立记忆系统。在图灵语料总库的基础上,让机器人学习并记忆每个用户不同的个性化数据。例如如果能持续记录用户的个人习惯,并做出相应的个性化调整,这能使得产品有更深的粘性。

第二,定制语义技能。图灵除了提供 AI 技术方案,也是 AI 的应用开发者,我们为优质合作伙伴定制自有资源的 AI 技能、知识图谱等。

第三,剧本式话题。根据动画片的剧本,生成每个 IP 独有的话题。例如,图灵与小猪佩奇、超级飞侠等 IP 合作,我们训练出来的内容与其他 AI 训练出来的内容不一样。当我问它,你有去过巴黎吗?如果是小猪佩奇就会回答,「法国就在我们隔壁,我经常去」;如果是超级飞侠就会回答,「我本来就会飞,想去哪里就去哪里」。

响应客户的需求,图灵还对大量儿童课本教材做了 AI 内容和服务输出。

AI+IP 是国际大趋势,儿童智能产品应该是小朋友的梦想载体

无论是图灵和日本夏普合作的 RoBoHoN 机器人、Sphero 新品、还是和电影『蜘蛛侠』一起上市的会说话的蜘蛛侠,以及迪斯尼 AI 剧本专利,我们都能发现,AI+IP 也是国际上儿童产品的趋势。

图灵做了大量关于「儿童喜欢玩什么」的调研。这些都是我们的实地调研:墨西哥的这位男孩喜欢小汽车,意大利的这位女孩喜欢各种公主裙和芭比娃娃,这个美国男孩喜欢飞机,这个中国男孩喜欢枪和炮。

儿童喜欢玩什么?答案抽象出来,就是给他一个梦想的载体。以上四组分别体现了小朋友的驾驶员的梦想、公主梦想、飞行员梦想、以及当一名战士的梦想。

小结一下:AI 天然自带一种人格属性,它就是一个有生命的机器人。而多模态交互能让 IP 角色更加丰富,以满足儿童丰富多彩的梦想。在此基础之上,我们再为产品加入智能化的内容和服务,就可以帮助儿童产生对学习更大的乐趣。

以上就是我的分享,谢谢各位!


整理、编辑:陈壹零、谈喆 @深圳湾

Back to top btn