Uploads%2farticles%2f12274%2fware      .002
|
2018-04-24

Synaptics Saleel:现有人机交互界面技术的创新应用,将为用户带来语音 AI 的沉浸式体验 | WARE 2018

关于语音智能硬件,大部分人都或多或少了解一些名声响亮的产品商和技术提供商。殊不知,为了实现技术落地、并与产品服务实现无缝的结合,背后还有不少默默为之操心的技术开发提供商。而 Synaptics 就是这样一家「产品背后的公司」,致力为智能设备提供创新性和直观式用户体验,拥有包括语音、生物识别、触控、显示、处理和成像的技术。

在此次峰会,Synaptics 全球副总裁兼语音和图像部门总经理 Saleel Awsare 就「下一代环境感知语音 AI」进行了主题分享。

随着语音、视觉等 AI 技术的发展,智能设备也将得到变革,从过去人们需要主动学习怎么使用设备,到现在人们在众多设备(手机、平板等)之间自如控制。Saleel 认为,在未来,智能设备将在环境感知 AI 的驱动下适应用户,在这过程中,语音交互将从事务性处理向环境感知处理转变,它会自动识别用户以及用户环境,并根据对话内容提供相应的场景服务。

另外 Saleel 还进一步表示,仅仅需要创新性的想法和应用,利用 Synaptics 现有的语音、图像、生物识别、扩展显示等人机交互技术,我们将能创造出一个真正的沉浸式智能人机交互体验。

————————嘉宾演讲实录————————

演讲嘉宾:Saleel Awsare / Synaptics 全球副总裁兼语音和图像部门总经理
演讲主题:语音、图像、生物识别,人机交互领域的技术趋势和最新应用

作为一家致力于人机交互界面厂商,Synaptics 致力于交互技术的革新和应用

Synaptics 是一家致力于人机交互界面厂商,致力为智能设备提供创新性和直观式用户体验,拥有包括语音、生物识别、触控、显示、处理和成像的技术,已经在 PC、移动端手机、车载、IoT 等领域有丰厚的技术积累。

早在 2007 年,我们组建了语音技术团队,专注于 Audiosmart;2012 年,全球首款支持语音功能的电视机发布,搭载了 Synaptics AudioSmart 技术;2015 年,Synaptics 为主要 PC OEM 厂商提供语音技术合作体验;

到了 2017 年,Synaptics 已与亚马逊、微软、百度、腾讯、SK Telecom、Korea Telecom、Naver、Kakao、NTT Docomo 等知名厂商合作发布 AudioSmart 开发套件。

在过去一年,Synaptics 一共支持了 70 多个远场语音产品的实现。囊括的产品包含智能音箱、机器人、智能冰箱、智能灯、智能车载配件等等。

作为一家人机交互界面技术开发提供商,Synaptics 致力于 Voice Product 多年,已经见证了语音人机交互技术在不同时代、在各类产品中的应用。

借助下一代环境感知语音 AI,智能设备将得到革命性发展

从 PC 到移动互联网,再到如今的物联网时代,我们明显感觉到人机界面技术正在发生变化。从穿孔卡、键盘、鼠标、触控,大家即将迎来语音交互的时代。

我们也了解到,在过去 4-5 年间,Siri 等语音助手主要被应用在手机移动端。而在这两年里,语音交互技术得到快速发展,并且正在渗透到我们生活的方方面面,达到「无处不在」的地步。

随着语音、视觉等 AI 技术的发展,人机交互方式正在发生改变,而重要的是,我们使用的智能设备也在发生变革。从过去人们需要主动学习怎么使用设备,到现在人们在众多设备(手机、平板等)之间自如控制。

我们认为,能够自动感知、适应用户的 AI 设备是下一代设备的趋势,人们不需要学习或接触设备,而是设备反过来主动感知环境和用户。其中,拥有自主学习能力的「环境感知语音 AI」在起到关键作用。

在这过程中,语音交互将从事务性处理向环境感知处理转变,它会自动识别用户以及用户环境,并根据对话内容提供相应的场景服务。

环境感知语音 AI 在家庭、办公、车载、动态(On The GO)等场景下的应用

在环境感知计算的作用下,环境感知语音 AI 能实现从各个感观上「洞察」用户状态和需求,包括:

  • 可以探测到用户的注视,实现无缝交互。`
  • 解读用户情绪,作出积极回应。
  • 从人群中识别特定用户的声音和指令。
  • 预估用户的距离、语气和情境。

另外,目前语音指令大多在云端处理,未来,在智能云端的帮助下,语音指令将实现在本地处理,以保障用户隐私安全、提升语音 AI 的响应速度以及产品体验。这也是语音 AI 交互模式的一大趋势。

「无处不在」的语音 AI 被广泛应用到家庭、工作、车载、On The Go 等场景,而相应的环境感知语音 AI 也必须具备识别用户(包括多个不同用户)、位置、对话情景的能力。

例如,在家庭场景下,用户说「外面太冷了,我会留下看场电影」。试想一下,AI 会根据对话语境理解用户需求并提供这样的服务:温控器会自动调高室内温度,电视机会根据用户喜好搜寻好一堆影片,烤箱会主动你是否需要准备一些爆米花……

同样的,在工作(办公)场景下:

在车载场景下:

在动态(On-The-Go)场景下:


在 Synaptics 现有的语音、图像、生物识别等人机交互技术基础上,打造出真正的沉浸式语音界面

针对下一代环境感知语音 AI,基于 Synaptics 现有的人机交互界面技术,我相信,创新的想法将使得这些技术得到巧妙的应用,并打造出一个真正的沉浸式语音界面,它拥有更智能的边缘计算能力。

对此,Synaptics 具备多年以来积累的触控、图像、视频、生物识别、语音/音频、显示等人机交互界面技术,拥有着强大的基础优势。作为人机交互领域的探索者,Synaptics 将不断挖掘技术趋势和最新应用。


Q&A

Q1: 如何让设备识别你的指令是对它还是针对朋友讲话?

Saleel Awsare:我们的技术对环境的噪音做了很多过滤和筛选、区别,可以帮助机器识别到你的语音。在未来,我们会用一些 AI 技术,更好的判断你是在对朋友讲话还是对设备讲话。我们这个技术现在叫 DSS。

Q2:设备怎么识别声音来自机器还是人?如果我把另外一个音箱放到音箱旁边的时候,另外一个音箱会触发这个音箱,怎么办?

Saleel Awsare:我们做的分离技术就旨在区分这两者,人和机器识别的频率和声道都不一样,这是其中的原理。目前,我们跟亚马逊正在合作一个项目,就是确保设备在广告播放的时候不被误唤醒。在未来,我们会利用 AI 技术将声音做出更好的区分。

Q:许多语音交互服务是在云端运行,后续会把大部分应用都放到本地,这样一来,不需要云端也不需要 WiFi 和网络,这是通过什么样的技术来实现的呢?

Saleel Awsare:目前大部分语音交互都还是在云端进行,下一步,通过机器学习,终端本地化的能力会得到提升,未来将实现一部分的本地处理。


整理、编辑:Jes / 深圳湾

Back to top btn