Rokid 公布全栈语音解决方案:边缘人和他怀中的尖刀

陈凯文 陈凯文 发布于2017-10-12 23:02

昨天,阿里巴巴在云栖大会上宣布成立达摩院之后,Rokid 的公众号发布了一篇文章,题目是「达摩院外的边缘人」,作者在文章中说,「我们坚信未来改变世界的,是那些聚光灯之外的边缘人。」

今天,在 AliGenie 开放平台发布会之前,Rokid 的 CEO 祝铭明(Misa)在阿里云 IoT 分会场公布了 Rokid 自己的全栈语音解决方案(turn key solution),开始了面向语音和智能行业的全面技术开放。

当 Rokid 的姊妹花 Alien + Pebble 秀了肌肉并赢得了赞美后,Rokid 在硬件、AI 能力、以及内容和服务上,想怎样开放?

在 AliGenie 正式发布之后,BAT 巨头们在语音智能领域的平台布局算是全部展露了完整面貌。对语音智能产品厂商和开发者来说,各个平台开放相关技术方案时的软硬件「标配」已经非常熟悉。同样,Rokid 全栈语音解决方案也提供了包括硬件、软件技术和内容服务以及参考设计在内的全套产品支持体系。

Rokid 的开发板

硬件上,Rokid 做了一块十分漂亮的开发板,搭载了包括麦克风阵列、CPU、GPU 和信号处理在内完整硬件配置,并配备了 3.5mm 音频接口、Micro HDMI、Type-C 等丰富接口,可分别搭载 Linux 和 Android 操作系统,并根据需要选择阿里云或 Rokid 的语音服务,开发者和合作伙伴能够免费同时共享两方的语音技能。

这个开发板几乎等于把若琪产品的硬件内核直接抠了出来,接个音箱就能实现与 Rokid 自家产品同等的智能语音效果。

提供更加丰富开发能力的扩展板

语音和语义上,Rokid 开放的技术包括语音识别、信号分析处理、语音合成、语义理解、自定义唤醒词、声纹识别、个性化语音合成、语种识别、自定义对话引擎等等。

昨天在 Rokid 办公室,笔者体验了 Rokid 自定义唤醒词的实际效果,在 Rokid 用户手机端直接输入任意唤醒词(目前要求三个或三个以上汉字)之后,无需任何训练就可以立刻使用自定义唤醒词来唤醒 Rokid Pebble,在特意尝试了气音、叠字等有些刁难意味的唤醒词之后,Rokid Pebble 都能够成功被唤醒。

此外,在 Misa 的预告中即将上线的功能还有语音合成(5 分钟语料训练就能让 Rokid 的声音变成任何人);语种识别(无需设置直接识别说话人语种并用同样语言进行对话);声纹识别(Misa 特别强调是「真正的」声纹识别)都是在语音领域十分领先的技术应用。

在内容和服务上,Rokid 已有的大部分音乐、有声书、儿童故事、新闻、天气、购物等内容和服务都将免费开放给合作伙伴Rokid 还在开发一些无限轮对话游戏,例如由 Rokid 来主持游戏的「一夜狼人杀」、猜歌名游戏「音乐达人」、儿童教育游戏「小小数学家」等等,届时也将在 Rokid 应用平台上开放。

Rokid 提供的内容和服务

其中,在 IoT 领域,Misa 自信地表示,Rokid 是国内目前连接物联网产品最多的公司,能够与阿里小智、小米、Lifesmart、Broadlink 等多家公司的智能家居产品直接连通,并进行场景化的操控。

Rokid 在 IoT 领域的合作伙伴

当 Rokid 准备好开放自己的技术时,无法绕过的一个问题是,Rokid 和其他语音技术平台方的区别在哪里?

Misa 的回答很简单,Rokid 是国内唯一一家,花了整整三年时间,走完了从技术研发,到产品设计和打磨,再到硬件生产的打造语音智能产品全过程的公司,正因为如此,Rokid 也是唯一能够提供真正「全栈」方案的公司。

尽管 Rokid 是国内最早涉足语音智能领域的公司之一,但受 Misa 个人风格的影响,在很长一段时间里,Rokid 都不是最显眼的那个,特别今年 BAT 巨头加入角力之后,Rokid 虽然也开始展露在布局线下渠道上的攻势,但在奋力抢占平台红利的同行中间,Rokid 更加成了不怎么合群的「边缘人」。

对此,Misa 有自己的想法,「所谓的边缘人不是真的从主流中孤立自己,而是在边缘以冷静的视角观察,积蓄自己的力量,伺机而动。」

在 BAT 纷纷开放语音智能平台和技能市场后,作为创业公司的 Rokid 凭什么还自信有机会?

而 Rokid 技术开放的布局和模式,早在 Rokid 成立之初就已经在积蓄力量了。Misa 把这个模式总结为尖刀产品+技术开放,Rokid 内部从一开始就有平台部门,只不过一直以来,这个部门的唯一「客户」只有 Rokid 自己的产品部,两个部门在「互虐」中更新、反馈、完成一次又一次软硬件上的打磨和优化。如今开放全栈语音解决方案,对 Rokid 来说只是这个平台部「开门接客」了而已。

Misa 说,Rokid 开放的能力,其实是做产品过程中自然形成的,「当你打造完一个产品以后,一家公司在做端对端的细节打磨过程中会沉淀出一个全栈的技术能力。」对自始至终定位于 C 端产品公司的 Rokid 来说,把这些技术开放只是(反正留着也是浪费的)「边缘业务」。

Rokid 开放的全栈技术能力

尖刀产品+技术开放的模式,也是 Rokid 区别于 BAT 等平台方的主要特点。相比软实力强大,但在硬件产品打造上能力相对薄弱的巨头,Rokid 把打造极致产品放在首位。始终拿出好的产品,一方面能够教育消费者,为语音智能类产品营造一个良好的消费者认知;另一方面,也为行业竖立一个足够好的行业标杆,告诉行业只要愿意下功夫打磨,产品都可以做到这个样子。

在对接合作伙伴时,Rokid 将主要与方案商合作,由他们对技术方案进行进一步定制化、多样化,最终帮助到落地的产品厂商。Misa 透露,Rokid 已经开始为海尔,长虹,暴风,中兴等厂商提供语音解决方案。

在产品定价上,Rokid 自己的产品将一直定位于高端,避开了与未来可能的合作伙伴和小米等性价比推土机直接竞争的可能。

举个不甚恰当的例子,Rokid 想成为的,是把 iOS 和 iPhone 技术方案全面开放的苹果,而 Alien、Pebble 以及即将推出的随身智能语音产品,就是 Rokid 布局中的「iPhone」,是消费者心目中的品牌、标签和认同感,是行业的标杆,是这个边缘人揣在怀里的尖刀。

只要这把刀始终足够锋利,Rokid 就能在智能的人工智能的红海中披荆斩棘,用 Misa 自己的话说,「做一家能够一直做下去的公司。」

嗯,只要这把刀始终足够锋利。

3
0 评论
无评论
Back to top btn