不怕寒冬,主打便携智能的 Rokid 家族新成员 Rokid.Pebble 有望走向大众 | CES 2017
在这场 5000 多人参与的线上人工智能研讨会背后,更多的是 Rokid 对市场战略的思考
Rokid 期待能拥有属于自己的一片领地,也正在努力着。
去年 9 月份,人工智能初创企业 Rokid 宣布完成 6500 万美元的 B 轮融资,一跃成为市值 4.5 亿的公司。紧接着,在今年年初,Rokid 被福布斯当选为全球 AI 公司里的 Top 50。
近日,这家公司组织了内部 5 位分别负责工业设计、声纹识别技术、人工智能、深度学习等方面的博士、专家在知乎开展了一场线上 live,吸引了超过 5000 人参与,据说是有史以来由企业举办的 live 里参与人数最多的一场。可以说,这场 live 不仅仅是为了公司、产品的宣传,还有的就是为公司招揽领域内人才。
Rokid 靠什么「讨好」消费者
从 2014 年成立以来,Rokid 就致力于人工智能的研发,其打造的第一代人工智能产品 Rokid 凭借高透光度曲面外壳、DLP 投影、三星 8 核 CPU 的高性能配置,以及独具「个性」的语音助手赢得的了业界和极客们的关注。
Rokid 第一代人工智能产品
新产品 Pebble 的外形设计:继续打破传统,将「用户体验」摆在第一位
相比 Google Home、亚马逊 Echo 等偏日常化的设计,Rokid 则显得激进些,并将设计作为提升「用户体验」的一项重点工程。
Rokid 打造的第二代产品——Pebble(月石)再一次打破了人们对这类产品的想象。Rokid 团队从单细胞生物上得到启发,采用圆形、曲线的设计,将 Pebble 打造成一个石头盆景般的外形,使其能够与家庭场景融为一体,更符合美观的要求。
Rokid 打造的第二代产品——Pebble(月石)
而这也意味着他们将要克服更多技术上的困难,例如在物理上如何避免音频受到干扰——据悉,同类的 Google Home,Echo 等之所以做成箱体形状,正是为了将拾音结构、音箱进行一定距离的区隔(分别在头尾两端)。
Rokid 工业设计师姜公略表示,他们从始至终都是将「用户体验」放在了第一位,包括其他同类产品所没有电池设置,使得产品能够在户外场景中使用。
通过人机交互设计解决人机对话「开口难」的问题
姜公略进一步表示,面对语音对话机器人,人们往往会出现「开口难」的问题,即不知道该如何与机器沟通。他解释道,这是由人们不了解机器人的边界、缺乏基于人机对话的经验所造成,这就像我们在跟一个婴儿谈话一样,得了解婴儿(机器)能够对话的范畴,从中积累和婴儿(机器)对话的能力。
姜公略表示,可通过设计改变这一现状。目前,人机交互主要包括 GUI(Graphical User Interface,图形用户界面)、VUI(Voice User Interface,语音用户界面)两种模式。
其中,GUI 具有直观、高效的特点,用户只需在电脑、手机等屏幕上获取信息并直接点选。而 VUI 这种以语音交互进行获取信息的方式则存在「低效」的劣势,这是因为,GUI 与 VUI 存在维度上的差异:GUI 是二维获取信息的方式,VUI 只是一维,需要用户从头到尾听或讲一遍信息,才能执行下一步操作。
Rokid 作为一款人机对话的产品,自然会面临这样的问题。姜公略解说道,基于大数据以及人工智能强大的算法能力,VUI 能够有很大的提升空间,为用户过滤大量的选择,提高输入、输出信息的效率。例如,在执行「餐厅推荐」任务时,机器人能够先将「日本菜」、「西餐」等选项供用户选择,首先筛掉一大部分信息,接着给予更接近用户意图的选择。当然,机器人也可在一开始时根据用户以往习惯进行推荐。
Rokid 就此基于人工智能算法的 VUI 设计,能够降低人机交互的复杂程度,并提高效率。
Rokid 的打造并非是「将手机语音助手搬上音箱」这么简单
要让机器人做到与用户顺畅交流,是人机语音交互面临的一大难题。Rokid 的朱磊博士表示,听到、听懂、反馈是机器与人交流的三个关键。他强调,Rokid 的打造并非是「将手机语音助手搬上音箱」这么简单,它在这三个环节都面临着重大挑战:
首先,需要解决「听到」的问题,也就是区分用户是不是在跟机器说话。通常的办法是使用语音激活词,一般情况下,许多同类产品包括 Google Home,Echo,微软 cotana 均采用三音节词,目的在于降低误激活率。为了迎合国内称呼二字人名的习惯,Rokid 最终选取了 Rokid(中文唤醒词为「若琪」)这一二音节唤醒词,克服大量技术难题,并前后花费了一年多的时间才得以完成。
其次,要让机器「听清楚」用户的声音,也就是远场拾音的技术难题,包括麦克风阵列下的波束、降噪、多麦克 VAD 等问题。朱博士表示,基于前人大量的基础工作,使得这项技术能够得到良好的解决,对于他们来说并非是大的难题。
最后就是解决回声消除方面的难题。目前技术能够处理信噪比大于 0 的情况。而在现实生活中,信噪比往往在 -30~-60dB 之间,已经超出技术本身的极限。
为此,Rokid 团队则采用非技术的手段,包括拾音孔、麦克风的方位设计、隔音、减震结构等,从技术、工艺、结构等多方面降低回声消除的难度。
可见,为了让产品能够更贴近用户、受欢迎,Rokid 团队将「用户体验」作为首要的衡量标准,在这基础上稳固的打磨人机交互设计以及 AI 技术,坚持着他们自身的准则,并为此花下了不少心思。
Rokid 的潜在问题与「迷茫」
虽然 Rokid 一直以来都坚持自己惯有的风格,希望将产品做到极致。但与 Google Home、Echo 等同类产品相比,Rokid 昂贵的成本使得产品自身价格偏高(Rokid 第一代产品价格在 5000 以上,Echo、Google Home 价格都不超过千元)。
不难想象的是,这样的价格已经令不少想尝鲜的人望而却步。除了价格,Rokid 对设计的高度重视已超过产品本身,这从 Rokid 此前借助机械臂展示产品的宣传片当中也能看出,Rokid 的定位倾向于偏高端消费人群,或者更通俗的讲,是偏「geek」。
其实,身为一家初创公司,Rokid 这样做似乎不太妥当。知乎上一位关注 Rokid 的投资者认为,Rokid 没有 Google Home,Echo 那样的数据、电商优势,尤其在后两者重点为巩固他们在搜索界、电商界地位而将硬件作为辅助、冲量的产品的情况下,Rokid 走出了靠卖硬件赚钱这样的一条道路,而这也注定是一条无比艰难的路。
从 Rokid 的布局看它对未来的思考
不过,在发展到了一定程度后,Rokid 也意识到了这一点。
在这场知乎 live 中,Rokid 相关负责人表示,Rokid 即将在 5 月 15 日发布的 Pebble 以及后续的新品,价格都会很「亲民」。这隐约的暗示着,他们希望通过降低价格的方式,让产品的触角伸向更多的消费者。同时,Rokid 也正积极寻求各方渠道合作伙伴。
目前,Rokid 已与部分智能家居、物联网厂商等产业上游企业合作,提供芯片及方案。另外,Rokid 也正在建设开发者社区,开放类似亚马逊 Echo 的软、硬件平台(包括语音识别、NLP、TTS、拾音模块等)。未来,Rokid 将会把这些开放给各中、小企业。
除了产品、渠道、商业合作伙伴等方面布局,Rokid 也十分重视底层技术的积累。在去年,继北京「Rokid A-Lab」之后,Rokid 紧锣密鼓的在硅谷部署了「Rokid R-Lab」,持续大力投入资源和人才在新技术的研发当中,脚步一刻都没放慢下来过……
从成立到现在短短两年多的时间里,Rokid 从 5 人的「咖啡厅创业团队」迅速成长为一个横跨中、美两国,遍布三地的人工智能研发中心,一路坚持拿到 B 轮投资并成为世界最有价值的人工智能企业之一。对于一家初创公司来说,实属不易,也是值得骄傲的资本。
而从这一路以来的变化,特别是商业模式方面的探索,我们也看到了他们的努力。