Uploads%2farticles%2f13473%2f
|
2019-09-26

亮剑语音与视觉能力,上新多款智能音箱,天猫精灵想说的都在这里 | 云栖大会

升级 AliGenie 4.0,首发语音芯片,还有眼花缭乱的智能音箱

连续三年在云栖大会上霸占了主会场人气的天猫精灵,这一次主打「温度」。

而谈到「温度」这个关键字,女生要比男生有多的多的优势。

就像比拼谁家排第一的问题,女生不用大声喊,她可能站在那里,不去争论数据,不为竞价排名,就透着温柔的霸气。

天猫精灵的当家花旦,阿里人工智能实验室总经理陈丽娟(浅雪),这一次请上了凯文·凯利开场视频致辞,请上了大老板阿里巴巴创新业务事业群总裁朱顺炎,阐释「有温度的机器智能」的发布会主旋律,请上团队成员释空和忘之分别做平台和产品发布,还请上了多位合作伙伴。

9 月 25 日下午,阿里人工智能实验室在云栖大会上发布了一系列软硬件新品,包括音箱和芯片,同时,天猫精灵内置的人机交互系统 AliGenie 已经升级到 4.0 版本。

深圳湾将带来本次发布会几项重大发布的详细报道,同时,当天推送的二篇文章中,我们将带来新品的上手体验。

系统

展示语音、视觉技术能力,推出 4 大开发者平台,拓展 3 大行业应用领域,AliGenie 4.0 全面阅兵

天猫精灵内置的人机交互系统 AliGenie 于 2017 年 10 月首次发布,经历了 4 年的进化,在语音、语义、视觉、模组、连接、内容生态、应用和服务生态、IoT 生态等方面,都有了沉淀。

截止日前,天猫精灵已经被准确唤醒 200 亿次,回答用户问题 180 亿次,声纹识别 2100 万人,已经成为服务人数最多的软硬一体化人工智能助手。

值得一提的是,阿里人工智能实验室的团队规模,也从最初的 30 人增长为 800 多人。

语音和视觉的技术能力:

AliGenie 4.0 首次实现了语音语义一体化,将识别和理解的错误率降低 23%。全领域的全双工自然对话能力,做到了一次唤醒,多轮自然对话,并且可以自由打断。同时也实现了本地语音语义识别,以及四川话和广东话的方言识别。

阿里人工智能实验室在 2018 年春季发布会上曾经首次亮相视觉能力在智能音箱上的延展应用,而在本次发布会上,阿里则再次强调了在普惠视觉技术研发上,部署重兵,在深度学习模型、边缘计算引擎、手势识别、精彩瞬间捕捉、肢体识别等能力上,都有了不少进展。

现场展示了 C 位跟随的视觉技术应用,并在即将上市的带屏智能音箱 CCL 上落地,实现视频通话中的智能跟随。

技能开发平台:

面对开发者,AliGenie 4.0 提供了更多的开发工具支持,更新了包括技能、内容、IoT、Inside 在内的 4 大开发平台。

其中,技能开发平台强调了模块化分装,通过 VUI 和 GUI 双引擎,降低技能和应用开发的成本,最快能实现 7 天上线。其次,融合了声屏技术的开发工具 TPL,将语音和视觉双交互的能力,快速部署到不同尺寸、不同形态的硬件设备上,做到一次开发、多屏幕自适应。

为了加快技能和应用的开发,AliGenie 4.0 还针对带屏类的语音交互设备,推出了「语音小程序」,通过账号授权、横竖屏适配、语音交互适配等语音工具链,实现现有手机小程序向智能设备终端的直接转化,且一次开发、多端分发

并且,在天猫精灵上开发的所有小程序,在支付宝、天猫、淘宝上,都可以并行使用。首批上线天猫精灵 CC 智能音箱的语音小程序有宝宝巴士、蚂蚁森林、斗鱼、闲鱼等。

内容开放平台:

在内容开放平台的升级策略方面,强调了 3 点:一是全自助介入,二是数据化运营,三是内容商业化。天猫精灵通过付费内容接入、精准推荐、付费导购、交易结算、互通会员体系等途径,实现内容生态的商业化,并预计将在今年双十一全面开放。

在内容资源的整合方面,阿里则拓展了传统出版业和音频平台两方面的资源,被点名的合作企业包括:浙江少儿出版社、安徽少儿出版社、米小圈、喜马拉雅、宝宝巴士、蜻蜓 FM、口袋故事等。

IoT 平台:

接着介绍的是 IoT 平台,包括本地秒回、蓝牙 Mesh 两大核心能力的升级,以及相应的设备端用户体验的提升。

具体来说,本地秒回强调的是控制类语音交互指令的本地化,即天猫精灵的端数据处理能力,实现了指令从云端到地面的秒级响应,延迟降低到了 0.4 秒。天猫精灵联合蓝牙技术联盟推出的 1 美元的蓝牙 Mesh 模块,目前已有千万级的出货量。

截止至目前,作为阿里巴巴家庭大脑的 AI 中枢,天猫精灵销售已经连续两年稳居中国第一、全球第三。而从硬件设备接入量上来看,天猫精灵已经接入了超过 660 多家 IoT 平台,覆盖超过 60 个产品品类,900 多个品牌,支持 3600 多个型号。AliGenie 的可连接设备量也增加到 2.35 亿,成为最大的 IoT 生态开放平台

Inside 平台:

本次发布会还首次亮相了 AliGenie Inside 平台,它整合了天猫精灵的 AI 能力,通过积木式能力和私有化定制搭建,帮助传统硬件完成 AI 智能升级。并将这一流程简化到 4 步 7 天,即产品定义、开发管理、语音接入、发布管理。

在酒店和民宿、智慧出行两个行业应用领域,天猫精灵已经拥有了很多合作案例,今年又新拓展了教育领域,联合人民教育出版社发布了智能教育生态平台

芯片

发布定制化语音芯片,平头哥玄铁的三核架构,支持本地处理 20 条指令

天猫精灵在 2018 年 6 月发布了价格只有 1 美元的蓝牙 Mesh 模组,目前,这一模组方案的直连采用量已经突破 1500 万片,能够实现 60 个产品类目的语音配网和 AI 控制,广泛应用于家电、照明、电工、健康、传感器等领域。

在思考 AIoT 时代需要怎样的语音模组或芯片的问题时,天猫精灵认为,双麦、远场,低成本、高可用,存储 <500KB 的精简算法,能够在本地处理 20 条指令的 NLP 等,都是要考虑的因素。

于是,承载了天猫精灵 AI 能力的语音芯片 TG6100N 问世了。TG6100N 为天猫精灵联合平头哥共同定制开发,采用玄铁的三核架构(CPU+算法+音频);QFN 封装方式,具有超高集成度;内置 512KB SRAM+8MB SDRAM,并具有可扩展的内存;TEE 安全机制,双向强身份认证;同时还具有超低功耗的特点。

天猫精灵这款智能语音芯片 TG6100N 将应用在即将上市的智能音箱新品上。

音箱

发布多款智能音箱,黄金角、点阵屏,还有一打儿让人爱不释手的方糖,以及超低价

自 2017 年 7 月 5 日,天猫精灵 X1 发布至今,已经有 9 款硬件产品面世。本次发布会发布了多款搭载 AliGenie 4.0 的智能音箱新品。

最薄的「智慧屏」智能音箱:天猫精灵 CCL & CCH

CCL 是天猫精灵首款带屏智能音箱 CC 的延续,L 则意指爱。产品正面配备了一块 7 寸、178° 广视角常亮屏,悬浮式全频扬声器,同时支持语音、视觉和触屏三种交互方式。

在设计上,为了做到了极致纤薄,在屏幕最薄处仅有 11.09mm。相应的,在机身顶部,采用了高信噪比的双麦克风方案,mic 信噪比在 5 米距离做到了 63dB。

天猫精灵 CCL 支持 C 位跟随的视频通话。特别的,屏幕采用了 105° 倾斜角度,较黄金倾角 110° 向下倾斜了 5°,为此,天猫精灵对屏幕里的摄像头做了 -5° 的移轴设计,让摄像头能够「直视」正在视频通话的家人,这样的画面效果,改变是显著的。

天猫精灵 CCL 还提供了 10GB 内免费的家庭云相册,以及丰富的视频资源。同时也在儿童模式上进行了升级,采用了 MiraVision 芯片级的护眼距离检测。通知支持智能家居控制和 Mesh 自组网。

天猫精灵 CCL 将于 9 月 27 日在天猫精灵官方旗舰店正式开售,售价 499 元,首发价 369 元。而天猫精灵为线下渠道打造的专业版 CCH,H 意指 Home 将于 10 月销售。

最温暖的「点阵屏」智能音箱:天猫精灵 IN 糖

天猫精灵 IN 糖的外观在方糖的基础了进行改版,正面是前置的扬声器,通过 LED 相距点阵的变化,产生多达 100 多种灵动表情。

IN 糖对声音调校做了细致打磨,中频段通透、顺畅,中高频明亮、具有穿透力,整体上更有风格。特别的,在人声最敏感 2500Hz 区域,将声音水平提升了 3dB,让人声更加突出,态度表达更加直接。同时,为提高音效,采用了通孔金属网罩,超低声阻材料。

天猫精灵 IN 糖 9 月 27 日在天猫精灵官方旗舰店正式开售,首发 199 元。

天猫精灵方糖 R:多啦 A 梦原声版

天猫精灵方糖于去年 5 月诞生,主打生动的造型和丰富的语音内容和技能,是国内第一套声纹识别系统的升级之作。

在今年 4 月 18 日天猫精灵 2019 春季发布会上发布,阿里巴巴推出了「糖粉计划」,允许明星、IP 和品牌厂商定制方糖 R,随后,m&m、皮卡丘、星巴克等新一代潮酷方糖 R 陆续发布。

最新的方糖多啦 A 梦不仅有蓝胖子叮当猫的造型,还有国语配音演员定制的 TTS,开机即能听到熟悉的声音。

产品 9 月 25 日上线造点新货众筹,众筹价 128 元。


微信号:shenzhenware

主笔:陈壹零 / 深圳湾

编辑:大零 / 深圳湾

>>
Back to top btn