Uploads%2farticles%2f12087%2f   .002
|
2018-01-30

最早发布语音合成芯片的公司 Sensory,缘何能成为三星、索尼、Google、华为的语音技术供应商?

这家巨头背后的方案商,为我们展示了三款最新的语音方案。

三星 S9 还未上市,便已经提前在手机界掀起了一阵阵波澜,人们对其人脸识别开锁+语音控制等问题充满了好奇。而作为最早与三星合作开发消费电子语音方案商 Sensory,也在顺势兜售了一把自家的语音方案。

网传三星 S9 渲染图

在不久前的 CES 2018 展会上,美国语音方案公司 Sensory 携带旗下三款核心语音方案——TrulyHandsfree、TrulyNaural 与 TrulySecure 参展,并基于这三种技术展示了数十种新产品和解决方案,合作方包括我们耳熟能详的 Amazon、Google、三星、LG、霍尼韦尔、摩托罗拉、英伟达、华为、中兴 、Anki 等知名品牌。

TrulyHandfree 语音识别技术:支持低功耗状态随时语音唤醒

TrulyHandfree 是一款嵌入式小型语音用户界面平台,植入了 Sensory 的语音识别技术。

据官方介绍其有两个核心优势:一是高语音识别率,在高噪声环境下也能保持 95% 以上的语音识别准确率;二是低功耗运行,该方案能在电池电量不足 2mA 的情况下依然能够完全运行。

目前该平台已经与三星、索尼、华为、Google、LG 、Intel、CEVA 等终端品牌及方案商建立了合作,可应用在智能手机、蓝牙设备、汽车电子等消费电子产品上。经过多次的版本迭代,最新版本的 TrulyHandfree 具备以下几方面的优势:

● 植入了深度学习模型,具备更高的识别搜索准确度

● 具备克服混响和恶劣声学环境的新算法;

● 高级滤波器组功能,可改善前端语音特征提取

与 TrulyNatural 完全兼容,实现从 TrulyHandsfree 到 TrulyNatural 处理器的无缝切换。

TrulyHandfree 目前与一些世界一流大厂建立了稳固的合作关系,以三星为例:自 2014 年 9 月起 ,Sensory 便成为三星嵌入式语音识别技术的主要供应商,其中 TrulyHandfree 技术被用作 S-Voice 语音触发器(后来演变为三星自研的 Bixby 语音助手),还被植入 Galaxy S/Note 系列旗舰手机、三星 Gear 系列智能手表及一些支持 S-Voice 功能的相机与平板中。

早期三星 Galaxy 手机 S-Voice 语音助手操作界面

2016 年三月 ,Sensory 还与英特尔达成合作协议,来为 Intel 的部分芯片提供语音识别功能,除了消费级电子产品 ,TrulyHandsfree 还被广泛应用在车载 、IC 卡、智能耳机、家用电器、银行、医疗等多场景领域。

TrulyNaural:嵌入式百万词汇量的自然语言识别系统

TrulyNatural 是一个具备大词汇量连续语音识别能力的嵌入式 NLP 语音引擎,其使用特定形式的深度学习算法建造小型的声学神经网络模型,这些模型能根据用户的语音特征进行关键信息提取,并结合 Sensory 百万量级的词汇库进行精准搜索,提供给用户自然流畅的语音体验。

TrulyNaural 任务处理流程架构

TrulyNaural 主要包含以下几方面特点:

  • 可拓展性强:包含一个微型 FST 传感器和一个小于 1MB 内存的嵌入式识别器模块,其存储容量最大可拓展至 1000MB;
  • 能提供精准、灵活、快速的语音检索:百万容量关键词检索,能将检索错误率降低至 8%;
  • 与现有通用标准与工具兼容:能与 OpenFST、Kaldi 等开源语言模型工具兼容,也可与 ATT FSM 等通用标准兼容。
  • 适用于多种语言:目前可支持英语、中文、韩语、法语、意大利语、葡萄牙语、西班牙语和俄语。

TrulyNaural 适合应用在汽车、物联网、移动电子等场景,其能与 TrulyHandsfree 完全兼容,能在 Sensory 语音识别技术基础上为消费端提供更灵活、快速、精准的语义理解及搜索能力。

Truly Secure:可应用在 PC、手机、耳机的生物识别技术

生物识别就是通过计算机与光学、声学、生物传感器和生物统计学原理等高科技手段,利用人体固有的生理特征(如指纹、人脸、虹膜、掌纹),及行为特征如(笔迹、声纹、步态等)来进行个人身份的鉴定。

早在 2012 年 ,Sensory 就曾推出了针对智能手机的声纹识别技术,并在 2014 年推出了高精度生物识别方案—— TrulySecure,该技术能摆脱繁琐的指纹和 PIN 码识别,通过声纹识别+人脸识别的技术结合提供身份识别方案。

TrulySecure 只需要一款 APP,几乎适用于任何麦克风与相机。但相较于苹果 FaceID 依靠 3D 深度摄像机,在用户面部投射 3 万个红外光点以识别人类面部细节相比,其安全性相对较弱,因而目前尚未在支付上获得商用。

2016 年 ,Sensory 开始与三星 IT 部门 SamsungSDS 合作,共同开发基于移动支付场景的生物识别支付软件,通过使用手机的前置摄像头和声控完成识别认证。目前这一方案已经应用到了部分三星、LG、及摩托罗拉的 Moto X 系列手机上。

在 AI 技术大行其道的今天,类似 Sensory 这样的语音方案公司也在顺势而为,在这新一轮的技术红利中获得了开拓领土的机会 。Sensory 首席执行官 Todd Mozer 曾在采访中说道:

「今天,从手机、可穿戴设备到客厅厨房的大型不同形式的感官 AI 技术均可以在从超紧凑可穿戴设备到大型厨房设备的产品中找到。」而 Sensory 的成功要归功于公司「与芯片制造商 ,IP 提供商和操作系统(包括 iOS、Android 及 Linux)等合作伙伴建立了牢固的关系」。



>>
Back to top btn