Uploads%2farticles%2f11668%2f1341531a096f102087
|
2017-07-07

7 分钟定制一个语音技能,思必驰投 2 亿开发者基金助力 DUI 开放平台


伴随着亚马逊 Echo 漂亮的销量数据报告,除了智能音箱本身,业界更是注意到了其背后 Alexa 智能语音助手 的重要能力。

自 Alexa 项目启动以来,亚马逊团队用时几年对其进行全方位的打磨,奠定了重要的技术基础。而从开放语音技术和平台后,Alexa 的实力更是得到了进一步的增强,到目前为止,Alexa 已接入手机、音箱、电视、冰箱、耳机、汽车等智能家居、移动硬件设备中,此外,Alexa 平台已经拥有超过 1.5 万个「技能」。

通过智能语音为硬件「赋能」已成为一大趋势,而从 Alexa 身上,包括 BAT 在内的语音技术方案商也看到了一条从技术、硬件应用、数据积累再到平台开放的道路

7 月 7 日,国内人工智能语音企业思必驰举行了 DUI 开放平台(AISpeech Dialogue User Interface)首秀,为开放平台正式上线前进行小规模的测试和体验。

本文将首次讲述该平台背后的故事,并深度解读该平台差异化的优势。

▎从暂停到项目再启动,DUI 开放平台成公司重要战略之一

做语音技术开放平台,对思必驰而言并不是偶然拍板子决定的事情。早在 2014 年 7 月 5 日的,思必驰就发布了国内的第一个口语对话系统平台——「思必驰对话工场」,在国内首次提出「对话服务」的概念,开放底层的 ASR、TTS、NLU 等 SDK 接口,同时设立专门的团队为对话系统开发提供技术支持。

但随着物联网之风兴起,思必驰调整企业战略,从教育领域全面转向智能硬件物联网领域,为智能车载、智能家居、智能机器人/玩具等提供端对端的口语对话交互系统。到了 2015 年底,因收紧人力专注业务的需要,凝聚企业精力,思必驰对话工场的业务也就暂时停止了。

随着所对接入的硬件越来越多,思必驰语音技术在物联网领域内的调用频次在今年上半年已累计超过 200 亿次,思必驰也因此积累了一大批用户群体。

近年来,在智能语音技术的突破和日渐成熟下,思必驰意识到开放平台的时机也即将到来,于是再次重新拾起该项目,并从各种小型项目着手进行不同的尝试,将部分以往所对接的特定任务场景下的对话系统转化成 Demo。对项目进行了一段时间的重新审阅后,思必驰于 2016 年初开始策划开放平台并结合业务进行了模块化尝试。

DUI 由思必驰副总裁赵恒艺领导,目前公司内专注于该项目的团队就已经超过 100 人,DUI 开放平台上升为公司的重要战略之一。

在接受深圳湾(公众号 ID:shenzhenware)的采访时,赵恒艺表示,从过去到现在,得益于大量的实践和技术的积累,思必驰的语音技术得到了长足的发展,例如,语音技术解码器一秒钟处理信息的数量由几千条增加到了近 55 万条,自然语言的处理信息效率提升了近 20 倍。这使得思必驰的整体语音技术开放能实现从解决方案级别到用户级别的跨越。

▎DUI 开放平台:从解决方案到用户级别的跨越

「一站式开发,高可定制,以对话为核心」是思必驰 DUI 开放平台的三大关键词。

据赵恒艺表示,DUI 开放平台的主要着眼点在于任务型对话,语音技能的创建也会依据任务划分这样一来,其开拓空间也会更大。

据了解,DUI 开放平台具有以下特点:

  • 可视化的编辑界面:平台内置深度定制技能,集合广泛的聚合类 API,并提供详尽的参考文档和示例,在网页上进行注册后,非专业人员也能迅速上手使用,快速生成 Demo。

  • 云+端混合方案:提供低功耗、反应快、可定制的语音唤醒、离线识别、离线技能等功能以及云端功能。包括系统更新方面,开发者在 Web 端发布后,用户即可从云端获取最新更新信息,避免系统更新缓慢等情况的出现。

  • 任务型多轮对话:打破传统语音解析的概念,以任务划分 Skill,进行复杂任务的设计。

  • 全流程的定制化:包括语音唤醒词的定制,内容资源、资料库的实时更新、以及技能的深度定制,此外还包括语音模型的可定制,包括每一轮交互的个性化定制、合成音的定制等。

推出 DUI 开放平台,也是思必驰与客户进行深度沟通,寻找行业痛点并解决痛点的一个过程,能进一步做好产品的打磨。此外,DUI 开放平台主要面向广泛物联网和移动互联网伙伴,开放平台将于 8 月底正式上线,开发者可用 7 分钟定制一个语音技能

▎加快产品迭代速度,推出可实时反馈的大数据平台

为了让客户、开发者能及时得到产品使用情况等信息的及时反馈,思必驰还专门设立了一支负责大数据运维的团队,推出基于语音、文本对话交互的可视化大数据平台

基于大数据,开发者可自定义周期、维度、范围查看平台的实时数据,包括用户、地区、流量情况、活跃数等。而这样的实时数据展现能力是目前业内所没有的。

另外,该系统下的用户反馈机制会定期内筛选出误识别、无反馈等问题,向开发者输出反馈报告,进一步加快产品研发迭代的速度。

▎专业语音技能商店,首先让客户由需求方实现向开发方的转变

在 DUI 开放平台的 技能商店 涵盖了效率,工具,生活服务,交通出行,影音视听,社交分享,新闻资讯,社交分享等多个领域。开发者可根据场景实际需求深度定制,支持第三方资服务资源的接入。同时,DUI 开放平台上的 为开发者提供大规模专业的Skills,增强开发者自定义能力。

赵恒艺表示,对于像语音技能这样的开发任务而言,如将平台直接开放给开发者让他们自行开发,大部分开发者并没有这个精力。目前平台上现有的技能主要是向客户、开发者呈现完整的模板,起到了示范和演示作用。赵恒艺坦言,Skill 这个东西「上手容易,做深难」,而亚马逊 Alexa 技能商店能有今天的成绩,很大程度得益于其在行业的地位和号召力。

另外,思必驰还专门设立了 2 亿元的基金,用于鼓励个人开发者,以及平台线上、线下运营的支持

▎让语音成为人工智能时代的入口

「目前,在国内智能语音行业内,并没有绝对的领先者,每个技术商均在某个领域有自己擅长的地方,AI 行业的机会还很大,BAT 从大着手,我们垂直技术厂商会从技术出发,去逐步解决问题。」思必驰市场总监龙梦竹如是说

在采访中,赵恒艺多次提及,他们希望实现的是,在人工智能时代,让语音成为一个连接各种服务和内容的接口

而目前他们需要做的是,面向物联网领域、移动互联网等,用语音赋能硬件,做好产品服务,为当下的客户、开发者提供良好的支持。


在深圳湾即将于 7 月 15 日举办的 WARE 2017 语音智能平台与应用峰会第 II 季 上,思必驰副总裁赵恒艺也将作为「语音先行·语音智能影响力论坛」嘉宾,首次深度解读思必驰的最新发布。目前,大会门票正在火热销售中,长按图片扫码,马上购票!(采访:Jes、Allen;主笔:Jes @深圳湾)

Back to top btn