Uploads%2farticles%2f11473%2fp2381327870
|
2017-03-31

问之科技:一家语音技术初创公司,该依靠什么拿下客户?


近年来,围绕着人工智能的创业团队如雨后春笋般出现,作为与智能产品进行交互的新兴方式,语音技术也被日益重视起来。不管是智能车载、机器人、还是智能家居,都将语音视作打开市场的重要利器。除谷歌、亚马逊、微软等巨头的重点布局,国内科大讯飞、云知声、思必驰等智能语音相关公司也都相继进入大众视野,并在短短几年的时间内得到迅速发展。

成立于 2015 年 9 月并在同年 10 月份获得千万元天使投资的问之科技,也在这样的趋势下成为了智能语音领域里的新秀。该公司的创始人兼 CEO 翟鲁峰曾负责阿里语音和图像的算法团队、盛大语音合成团队,公司其他核心团队成员也均是来自阿里、盛大等公司的语音技术专家。

目前,问之科技主要为 B 端客户提供语音交互、语音理解、语音合成一站式的整体解决方案,并聚焦在机器人、智能家居这两个领域

翟鲁峰表示,语音技术难以通过接入简单开放云 API 的形式满足家庭产品的需求,他们希望做的是,用业界前沿的技术配合对家庭智能产品场景的理解提供个性化的方案,打磨出限定场景下精准流畅的语音交互。

过跟客户一起对产品的不断调试优化,解决语音对话反应慢、不流畅等一系列问题,为产品打造个性化定制语音

与机器对话不流畅、准确率低、不够智能等缺点一直以来都为大家所诟病, 直接导致语音使用率的普遍偏低。为解决这一系列的问题,问之科技自主研发相应的技术并给出了以下解决方案:

通过加强版静音检测模块,让机器能及时被唤醒或响应;多模块协作以支持人机对话时的随意打断;Oneshot 唤醒 + 识别一把说让交互更流畅。

问之远程拾音模组

打造个性化语音方面,问之提出了「语音 DNA 」的概念,使得机器能够越来越「懂」它所服务的对象,以提高适配程度、以及识别的精准度。针对不同的使用场景具备应有的特点:

• 用户个性化:能够记忆并适配用户习惯

• 开发者个性化:一个引擎支持多个开发者模型

• 场景个性化:提供语义场景指导语音训练,修正语音识别结果

在个性定制语义的方面,问之提出了针对场景的 Aison 文法,能够克服机器普遍短时记忆的问题,长时记忆用户信息,实现多伦对话,甚至主动引导用户提供关键信息,以在用户下达单点模糊指令的情况下,进一步确保任务执行的准确度。另外,其实时增量索引的功能使语义能即建即得

通常,相对于无法支持大规模深度神经网络计算的传统离线语音识别,基于神经网络的在线语音识别效果更佳,但也会容易出现延迟、不稳定等问题。为此,问之研发了首款基于语音神经网络(DNN)芯片加速的离线语音识别,让家电控制灵活且更稳定、精准,实现本地端唤醒、云端识别。

了技术,就是能跟客户走得更近、响应更及时

目前,问之科技已与南江、棠棣、ROOBO 等上十家机器人、智能家居公司合作,提供相应的语音服务或共同打磨语音解决方案。

最近,问之科技已与部分智能家居领域的物联云进行了战略性的合作,进一步打通了技术壁垒,通过语音交互,语义理解,物联控制来为智能家居的用户提供语音控制,生活平台等服务。这样一来,智能家居的使用便利程度也能得到相应的提高。

从翟鲁峰的描述中,深圳湾(公众号 ID:shenzhenware)了解到,厂商在挑选语音技术合作方时,首先会了解语音和语义方案的特点,包括整体效果体验、延迟、模型数据量等,其次进行内部识别率评测,并考察方案是否符合本公司业务场景,最后,合作方是否愿意配合语音模型的训练也是其中一个非常重要的考虑因素。

「事实上,基于简单问答的语义技术门槛并不十分的高,但从长远来看,随着服务量大增,语音技术越是通用化(语音越来越接近人),技术也就越难,终究还是需要专业的团队做这样的事情。」翟鲁峰表示,目前,问之的语音技术训练时长已超过上万小时,拥有上亿条问答数据。除了深度个性化方面的能力,能够与客户走的更近、及时共同打磨出与产品相匹配的解决方案,是他们赢取客户的重要法宝。(本文作者:Jes @深圳湾)■

Back to top btn