Uploads%2farticles%2f11662%2fimg 0970
|
2017-07-06

推出首款声纹购物 AI 音箱,阿里瞄准的依然是你的钱袋

购物 AI 场景化后,剁手党该改名叫封口党了。

站在媒体圈看智能语音界的各路朋友,今天议论的热点都聚焦在了百度与阿里。两家巨头,两场迥然不同的发布会风格:一个火力全开,一个却如蜻蜓点水。

今天上午,近 4000 人参与了百度在北京举办的 AI 开发者大会,这是百度有史以来规格最高的一次人工智能大会。会上总裁兼 COO 陆奇发表了激情澎湃的演讲,公布了有关 DuerOS 语音交互平台 、Apollo 自动驾驶平台,以及百度大脑+智能云的几项重磅进展。讲台上的陆奇让人印象深刻,多次以「最」字冠名百度的 AI 技术,不断重申百度在 AI 界的地位。

与百度火力全开的发布会风格相比,阿里巴巴人工智能实验室在北京时间博物馆召开的一个小场发布会,则显得静水流深许多。发布会全程交由阿里巴巴人工智能实验室负责人浅雪(陈丽娟)主持,正式发布了国内首款 AI 购物智能音箱——天猫精灵 X1。

下面深圳湾分三个角度来解读这场发布会:

一看定位:阿里的首款 AI 消费级音箱,也是国内首款购物音箱,背靠电商,瞄准的依然是你的钱袋

阿里人工智能实验室负责人浅雪

准确来说,亚马逊 Echo 才是业内首款可购物智能音箱,只是可惜 ,Echo 还不会讲中文,国人也不习惯上亚马逊购物。

而国内最有望率先实现这个功能的,便是京东与阿里。京东旗下的灵隆科技,已经于两年前布局了智能音箱。如今阿里率先实现了语音购物,对于同是电商的京东来说,实现语音购物功能也不过是个时间问题。

发布会现场 直播测试了天猫精灵的购物功能。根据现场演示,仅需一句唤醒词,再加上告诉它商品名称,天猫精灵就能够自动根据销量、售价等参数推荐排名靠前的商品;然后经过声纹识别身份验证,就可实现支付宝自动扣款,而后续的物流信息也可通过语音查询。

天猫精灵产品经理释空介绍说:「由于淘宝商品品类丰富,名词繁杂,因此技术团队对所有商品信息进行了标签化整理,使得天猫精灵在向用户介绍商品信息时更加口语化。精准的声纹识别则保证了支付环节的安全性,也方便对商品售后服务的跟踪查询。

白色版天猫精灵 X1

当然,作为一款定位于家居环境使用的智能音箱,天猫精灵也集成了生活信息查询、健身助手、儿童陪伴等智能音箱的标配功能。不过,其中也有两项便捷功能让人颇为印象深刻。

第一是家用电器控制。根据释空的介绍,这款音箱能同时实现终端设备一对一、一对多的家用电器控制,还支持多种场景模式的选择。例如下班回家,唤醒天猫精灵后会自动切入回家模式,则设置好的必用电器,例如点灯、排风扇、电视、空调等会同步打开,此谓一对多;而如果觉得空调温度太低,或者灯光太暗,则可语音告诉音箱单独提升温度、灯光,此谓一对一。根据王自如现场的演示,利用天猫精灵来点播音频,或是操控电视点播视频节目,电器的反应速度也十分快速。

第二,则是寻找手机功能。大家或许都曾有过在上班时却发现手机不见了的窘迫时刻,而这时告诉天猫精灵寻找手机,它就会自动拨打手机号码,使用者再根据铃声或是亮光寻找手机。有人会想将来这款音箱会不会替代手机进行家人间的多方通信呢,这就得问其背后的阿里通信了。

二看技术:业内首款实现商用的声纹购物系统,无需 App 也可操作


整场发布会以产品应用为重点,在产品语音技术与硬件设计方面并没有深入挖掘。不过我们依然能了解到天猫精灵的一些产品技术与设计细节:

天猫精灵 X1 采用了圆柱形的设计,有黑白两种配色,高 126 mm, 直径 83 毫米,现场浅雪还专门将其与亚马逊 Echo 和 苹果 HomePod 作了对比,以显示其设计的小巧。

X1 顶部中央,配有一枚静音键。当用户触发此键时,X1 会立刻停止声音播放,并停止识音功能,以有效保证用户隐私。

在配置方面,X1 采用了业内首颗 SmartAudio专业处理芯片,相比此前市面上的主流芯片,处理效率提升 25% ,功耗降低 32%

X1搭载了 6 麦克风环形阵列,能够在家庭环境下实现 5 米范围语音识别。并经过专业音效调节的独立功放芯片,使得 X1 同时也具有优秀的外放效果。

X1 底部设计了一圈隐藏指示灯,会通过声音来判断用户方位,亮起灯光以示提醒,灯光还会根据不同使用功能和场景配合进行提示。

软件方面,天猫精灵则采用的是阿里自家团队研发的 AliGenie 语音交互系统,目前阿里人工智能实验室正在对声纹识别、声纹购 、NLP 中文对话引擎等核心技术申请专利,就在不久前,阿里的 NLP 技术团队还发表过一篇自然语言处理相关的论文。

既然是要实现语音购物,基于安全性的考虑,声纹识别功能就显得十分重要。阿里推出的声纹购是业内首个实现商用的声纹购物系统,当用户发起购物、充值等行为时,只需要说出声纹密码,识别系统将会自动进行身份校验,确认是本人后才会完成交易,否则将拒绝请求。

多轮对话技术方面,阿里技术团队则在自然语言理解的基础上,加入了「决策引擎」的机制,使得机器能更好理解上下文语境,并判断响应的模块进行决策。

通过深度机器学习,天猫精灵 X1 已兼容 20 个领域的自然语义理解。阿里人工智能实验室研发的中文语义理解引擎针对常用的定时,提醒,天气,娱乐内容,家居控制,助手,以及购物等领域进行了特别优化,仅天气预报就能够理解 786 种中文问法。

值得一提的是,天猫精灵可以安装天猫精灵 App 绑定账号对硬件进行设置,也可以通过「手机淘宝」中「我的设备」中进入操作界面,无需单独下载 App。

天猫精灵X1售价 499 元,将于 8 月 8 日正式登陆天猫开售。

三看团队:神秘的阿里人工智能实验室,可能还憋着很多大招

本以为阿里会借这次发布会,会顺便秀一下阿里人工智能实验室的肌肉,向外界展现其背后积淀的技术实力。遗憾的是,或许是为了避开百度的锋芒,又或许是未到最佳时机,整场发布会完美的避开了对阿里人工智能实验室这一角色的深度挖掘。

据了解,阿里巴巴人工智能实验室去年成立于杭州,办公地点就在阿里巴巴总部所在地西溪园区,隶属于阿里平台技术事业群,直接向 CTO 张剑锋(花名行癫)汇报。最近阿里另一个人工智能相关的部门 iDST 从亚马逊 Amazon Go 挖来了首席科学家任小枫打造无人商店,阿里 AI Labs 的初步发力则选择了智能音箱。不过与名号已经打响的 iDST 不同,在成立后,阿里巴巴人工智能实验室几乎未曾在公众视野中露面。

阿里人工智能实验室的负责人陈丽娟花名「浅雪」,曾是淘宝网第一代产品经理,历任一淘网运营总监、阿里智能云总监等职务。另一位重要人物——阿里巴巴人工智能实验室首席科学家王刚,曾在新加坡南洋理工大学任教,主攻研究方向为计算机视觉中的图像识别,于今年三月才加入阿里。

这个神秘的实验室的英文名为 A.I.Labs,复数形式不由得引人猜想,阿里的人工智能实验室应该不止一个,而是一个集群。阿里人工智能实验室主要负责阿里旗下消费级 AI 产品的研发,而此次的天猫精灵X1,是该机构发布的首款实体 AI 产品,后续涉及的产品范围可能会更广。

四看开放平台:已接入 100 多个品牌,未来将实现多场景覆盖

除了音箱,阿里还将开放 AliGenie 开发者平台给应用开发者、智能家居厂商、硬件生产商等,无需从头搭建 AI 语音系统,能节省研发上的巨额投入。下面是本次发布会采访环节关于 AliGenie 开发者平台的信息:

Q:AliGenie 目前所涵盖的功能包括?

A:目前有以下功能,随着更多功能的开发和第三方开发者的加入,功能将不断扩展

1. 音乐音频:海量曲库和内容库

2. 家居控制:语音控制智能家电设备

3. 购物充值:声纹实现购物全流程

4. 儿童教育:精选儿童音频内容,寓教于乐

5. 技能市场:汇聚各种服务和内容,不断扩展功能

Q:AliGenie 未来还会进入哪些生活及商业场景?

A:目前已经或正在拓展的行业解决方案有

1、 儿童领域

2、 酒店领域

3、 家庭场景下

4、 TO B 其他商业场景

5、 线下零售场景

6、 与其他显示设备结合的场景

Q:AliGenie 可接入的智能家电范围包括?

A:目前支持 100 多个品牌,包括接入阿里智能联盟、涂鸦科技 、broadlink 等智能家居方案的产品,更多智能家电正在接入中。

Q:AliGenie 开发者平台会开放哪些能力?

A:AliGenie 开发者平台主要面向四种类型的开发者,包括内容开发者、应用开发者、智能家居开发商和硬件生产商。开发者既可以创建技能,为更多的语音用户提供服务,也可以将自己的设备接入云端服务,获取语音交互能力。

依托强大的底层技术、智能的算法引擎、完善的云端服务和成熟的软硬件标准系统 ,AliGenie 会持续不断地将全面、易用的核心技术能力进行输出,为开发者带去更多可能。通过 AliGenie 开发者平台,开发者可以链接到阿里生态体系中的数亿消费者和海量的生活和商业场景。

Q:AliGenie 开发者平台有哪些核心技术开放?

A: 1、 深度学习

我们研发了国际领先的深度学习技术来作为 AliGenie 的大脑,这些技术成果被发表在顶尖国际会议例如 KDD 和 CVPR 上。我们自主研发的深度学习能快速高效的从海量数据中进行学习,并能在广泛的应用场景中使用。

2、 自然语言处理

基于我们积累的海量的自然语言数据,和自主研发的国际领先的深度学习技术,我们实现了高效准确稳定的自然语言理解。

3、 搜索/推荐算法

通过阿里积累的用户画像,为用户个性化地提供用户所需要的信息和内容服务。

4、 知识表示及推理问答系统

我们构建了一个海量的知识库,实现对万事万物的结构化的描述,这个知识库不仅帮助我们更好的理解语言,更重要的是可以通过推理回答各种知识类问题。

上述能力我们将免费开放给开发者和硬件厂商,无需从头搭建 AI 语音系统,节省在研发上的巨量投入,使开发者能够更好的为用户提供服务。

Q:如何成为 AliGenie 平台上的开发者?

A:通过我们的开发者平台,即可申请成为开发者,只需要简单认证,就可以使用我们的深度学习训练平台。

1、 通过官网进行注册,填写资料申请邀请码

2、 一周内发放邀请码,开放相关工具和平台

3、 可以利用平台进行相关的开发和应用,然后提交测试评审,通过后可以在应用商店上线

Q:硬件厂商如何将 AliGenie 集成到自己的产品中?

A:我们会推出全套的硬件参考设计方案,给予合作伙伴足够的支持。

1、 厂商通过官网申请合作文档和技术参考文档。

2、 我们将对申请进行评估,并与合作伙伴讨论准备相关硬件的设计方案、接入方案及商业策略。

3、 双方进行联合开发和测试,整个过程约 1.5 个月左右完成。

Q:什么样的智能硬件可以与 AliGenie 连接?硬件厂商如何加入?

A:目前阿里智能联盟的上千万智能家居设备已经能够与天猫精灵X1进行连接。

硬件设备厂商可以通过两种方式接入 AliGenie:

1.通过 SDK 接入

提供常用平台(如嵌入式Linux、Android)的 SDK 给到设备厂商 ,SDK 中包含了如长连接通讯、设备用户绑定、音频播控、状态管理等功能模块,封装其中的实现细节,开发者可以方便的进行接入。

2.通过协议接入

提供基于 Websocket 的一套标准化协议,由厂商自行进行对接,直接调用 AliGenie 的各项能力。

Q:开发者如何分成?

A:开发者可以获得全部收益,平台在推广期间不参与分成。我们还会推出相关的阿里 AI 创新开发者计划。

进一步详细的开放信息将在今年 10 月的阿里云论坛上进一步公开。

>>
Back to top btn