Uploads%2farticles%2f13224%2f640 1
|
2019-06-11

亚马逊发布 Alexa Conversations,对话式技能开发工具升级

更低的技能开发成本、更好的技能交互体验。

近日,亚马逊 Alexa 发布了一条关于语音技能开发的消息,引起了开发者的广泛关注。一位从事对话式产品设计领域数年的资深产品设计师,在他的个人公号里,描述和分析了这一事件。本文转自他的个人公号,深圳湾略有改动。

是什么

6 月 5 日,亚马逊发布了一个基于深度学习的对话式技能开发工具—— Alexa Conversations,它将帮助开发者使用更少的代码和更少的数据训练,就可以开发出更灵活自然的对话体验,也将帮助用户更好地发现技能、更加平滑自然地通过对话满足多需求场景。

以技能 Atom Tickets 为例,开发者之前使用了 5500 行编码和接近 800 条训练示例。并且开发者需要编写每个对话交互模型、管理对话前后端业务逻辑、并分析日志进行测试和迭代。

而现在开发者只需要提供对话示例,Alexa Conversations 将会使用深度递归神经网络将对话路径进行预测建模。在运行时,神经网络将会结合会话历史记录来预测后续最佳的对话操作步骤,以提高准确性并且减少开发者的设计和代码成本。通过训练,它将被用来解释对话上下文,以用于处理多个用户工作流、适配用户的自然输入(例如顺序错误的信息或者更正)、处理常见的业务事务错误,并主动为用户推荐其可能潜在需要的 API 能力。

在使用 Alexa Conversations 后,技能 Atom Tickets 缩减了 70% 的代码量。仅仅需要 1700 行代码和 13 个用户对话示例,就能完成原来 5500 行编码和接近 800 条训练示例所能达到的效果。

Alexa Conversations 当前为预览版,目前仅面向美国开发者申请试用。

有什么意义

语音技能当前生态蒸蒸日上,有着数万的技能数量,大量知名企业也陆续上线自家的语音技能,但是语音技能也还是面临着各种质疑挑战,其中就包括:

1、优质技能的研发成本不低;

2、技能的发现难。

这次新发布的 Alexa Conversations,剑锋就是直指这两个挑战。

第一个是开发成本降低。通过几个对话示例和不多的代码量就能打平之前的语音技能效果,生产效率极大提升,这对技能开发者而言实在是一大利好。在正式对外发布时,是否能达到宣传时所体验的效果看能还需要观察。

第二个是语音技能发现难。手机中想用什么 APP,用户直接点击手机桌面的 APP 图标就能打开,基本没有记忆成本。但是对话场景就要棘手很多,尤其是无屏对话场景,用户可不能记住那么多语音技能的名字,实际上用户最自然的需求是「我要订餐厅座位」,而不是「我要打开 OpenTable 技能来完成订餐厅座」。

有什么启发

在亚马逊 re:MARS 2019 大会上,Alexa 现场展示了 Alexa Conversations 在处理用户多个需求时的效果。

视频演示中,Alexa 平滑顺畅地满足了用户在一个对话流中提出的多个需求,其中包含了订电影票(Atom Tickets)、地址问询、预订餐厅(OpenTable)、打车(Uber)、播放电影预告片等多个能力,成功地通过 Alexa 完成了多需求的晚间场景规划。

用户只需要表达大概的需求,Alexa 就可以主动选择可以满足其需求的对应技能 API,并且为其完成所需操作。

用户甚至不需要去关心 Alexa 用的是哪一家服务资源方。实际 Alexa 演示中也是如此,用户只显式提及了 Uber,其他的服务都是由 Alexa 静默完全选择。

仔细分析会发现,Alexa 只会通过一个技能来满足具体需求,例如 Uber 的打车和 Atom Ticket 的餐厅订座,其实真正受益的可能只是这批最头部的品牌技能。这也合理,毕竟对大部分普通用户而言,不需要太多选择甚至不需要选择,只需要给到最好最合适的服务就够了。

这也意味着 Alexa 将对服务分发拥有更多的掌控权。不过值得一提的是,这种掌控权不是这次能力升级所带来的,这是 Alexa 这种平台级产品与生俱来的绝对优势,只是这次升级将其体现得更为明显。

小结

总结来说,Alexa Skills Kit 一直是试图在做两件事情:更低的技能开发成本、更好的技能交互体验。这次发布的 Alexa Conversations 在试图同时优化这两个方向,值得期待。

本文作者:武良呈,资深产品设计师,从事对话式产品设计领域数年,关注国内外对话式软硬件产品领域发展。

编辑:森林木 / 深圳湾

>>
Back to top btn