2018-04-24

Synaptics Saleel：现有人机交互界面技术的创新应用，将为用户带来语音 AI 的沉浸式体验 | WARE 2018

借助下一代环境感知语音 AI，智能设备将得到革命性发展，它可智能识别用户、位置以及对话场景。

关于语音智能硬件，大部分人都或多或少了解一些名声响亮的产品商和技术提供商。殊不知，为了实现技术落地、并与产品服务实现无缝的结合，背后还有不少默默为之操心的技术开发提供商。而 Synaptics 就是这样一家「产品背后的公司」，致力为智能设备提供创新性和直观式用户体验，拥有包括语音、生物识别、触控、显示、处理和成像的技术。

在此次峰会，Synaptics 全球副总裁兼语音和图像部门总经理 Saleel Awsare 就「下一代环境感知语音 AI」进行了主题分享。

随着语音、视觉等 AI 技术的发展，智能设备也将得到变革，从过去人们需要主动学习怎么使用设备，到现在人们在众多设备（手机、平板等）之间自如控制。Saleel 认为，在未来，智能设备将在环境感知 AI 的驱动下适应用户，在这过程中，语音交互将从事务性处理向环境感知处理转变，它会自动识别用户以及用户环境，并根据对话内容提供相应的场景服务。

另外 Saleel 还进一步表示，仅仅需要创新性的想法和应用，利用 Synaptics 现有的语音、图像、生物识别、扩展显示等人机交互技术，我们将能创造出一个真正的沉浸式智能人机交互体验。

————————嘉宾演讲实录————————

演讲嘉宾：Saleel Awsare / Synaptics 全球副总裁兼语音和图像部门总经理
演讲主题：语音、图像、生物识别，人机交互领域的技术趋势和最新应用

作为一家致力于人机交互界面厂商，Synaptics 致力于交互技术的革新和应用

Synaptics 是一家致力于人机交互界面厂商，致力为智能设备提供创新性和直观式用户体验，拥有包括语音、生物识别、触控、显示、处理和成像的技术，已经在 PC、移动端手机、车载、IoT 等领域有丰厚的技术积累。

早在 2007 年，我们组建了语音技术团队，专注于 Audiosmart；2012 年，全球首款支持语音功能的电视机发布，搭载了 Synaptics AudioSmart 技术；2015 年，Synaptics 为主要 PC OEM 厂商提供语音技术合作体验；

到了 2017 年，Synaptics 已与亚马逊、微软、百度、腾讯、SK Telecom、Korea Telecom、Naver、Kakao、NTT Docomo 等知名厂商合作发布 AudioSmart 开发套件。

在过去一年，Synaptics 一共支持了 70 多个远场语音产品的实现。囊括的产品包含智能音箱、机器人、智能冰箱、智能灯、智能车载配件等等。

作为一家人机交互界面技术开发提供商，Synaptics 致力于 Voice Product 多年，已经见证了语音人机交互技术在不同时代、在各类产品中的应用。

借助下一代环境感知语音 AI，智能设备将得到革命性发展

从 PC 到移动互联网，再到如今的物联网时代，我们明显感觉到人机界面技术正在发生变化。从穿孔卡、键盘、鼠标、触控，大家即将迎来语音交互的时代。

我们也了解到，在过去 4-5 年间，Siri 等语音助手主要被应用在手机移动端。而在这两年里，语音交互技术得到快速发展，并且正在渗透到我们生活的方方面面，达到「无处不在」的地步。

随着语音、视觉等 AI 技术的发展，人机交互方式正在发生改变，而重要的是，我们使用的智能设备也在发生变革。从过去人们需要主动学习怎么使用设备，到现在人们在众多设备（手机、平板等）之间自如控制。

我们认为，能够自动感知、适应用户的 AI 设备是下一代设备的趋势，人们不需要学习或接触设备，而是设备反过来主动感知环境和用户。其中，拥有自主学习能力的「环境感知语音 AI」在起到关键作用。

在这过程中，语音交互将从事务性处理向环境感知处理转变，它会自动识别用户以及用户环境，并根据对话内容提供相应的场景服务。

环境感知语音 AI 在家庭、办公、车载、动态（On The GO）等场景下的应用

在环境感知计算的作用下，环境感知语音 AI 能实现从各个感观上「洞察」用户状态和需求，包括：

可以探测到用户的注视，实现无缝交互。`
解读用户情绪，作出积极回应。
从人群中识别特定用户的声音和指令。
预估用户的距离、语气和情境。

另外，目前语音指令大多在云端处理，未来，在智能云端的帮助下，语音指令将实现在本地处理，以保障用户隐私安全、提升语音 AI 的响应速度以及产品体验。这也是语音 AI 交互模式的一大趋势。

「无处不在」的语音 AI 被广泛应用到家庭、工作、车载、On The Go 等场景，而相应的环境感知语音 AI 也必须具备识别用户（包括多个不同用户）、位置、对话情景的能力。

例如，在家庭场景下，用户说「外面太冷了，我会留下看场电影」。试想一下，AI 会根据对话语境理解用户需求并提供这样的服务：温控器会自动调高室内温度，电视机会根据用户喜好搜寻好一堆影片，烤箱会主动你是否需要准备一些爆米花……

同样的，在工作（办公）场景下：

在车载场景下：

在动态（On-The-Go）场景下：

在 Synaptics 现有的语音、图像、生物识别等人机交互技术基础上，打造出真正的沉浸式语音界面

针对下一代环境感知语音 AI，基于 Synaptics 现有的人机交互界面技术，我相信，创新的想法将使得这些技术得到巧妙的应用，并打造出一个真正的沉浸式语音界面，它拥有更智能的边缘计算能力。

对此，Synaptics 具备多年以来积累的触控、图像、视频、生物识别、语音/音频、显示等人机交互界面技术，拥有着强大的基础优势。作为人机交互领域的探索者，Synaptics 将不断挖掘技术趋势和最新应用。

Q&A

Q1: 如何让设备识别你的指令是对它还是针对朋友讲话？

Saleel Awsare：我们的技术对环境的噪音做了很多过滤和筛选、区别，可以帮助机器识别到你的语音。在未来，我们会用一些 AI 技术，更好的判断你是在对朋友讲话还是对设备讲话。我们这个技术现在叫 DSS。

Q2：设备怎么识别声音来自机器还是人？如果我把另外一个音箱放到音箱旁边的时候，另外一个音箱会触发这个音箱，怎么办？

Saleel Awsare：我们做的分离技术就旨在区分这两者，人和机器识别的频率和声道都不一样，这是其中的原理。目前，我们跟亚马逊正在合作一个项目，就是确保设备在广告播放的时候不被误唤醒。在未来，我们会利用 AI 技术将声音做出更好的区分。

Q：许多语音交互服务是在云端运行，后续会把大部分应用都放到本地，这样一来，不需要云端也不需要 WiFi 和网络，这是通过什么样的技术来实现的呢？

Saleel Awsare：目前大部分语音交互都还是在云端进行，下一步，通过机器学习，终端本地化的能力会得到提升，未来将实现一部分的本地处理。

整理、编辑：Jes / 深圳湾

Synaptics

语音智能

WARE2018

深圳湾（微信公众号 ID：shenzhenware）是最早也是最活跃的硬件创新社区和媒体，关注「软件+硬件」带来的场景和交互创新，以及与平台和应用相连的产业链升级。

上一篇：小米崔宝秋：用设备和场景倒推 AI 技术进步，智能手机+IoT 是 AI 的无限生态 | WARE 2018

下一篇：何止 Meta x Oakley，小米等十家 AI 拍摄眼镜上新！下半年好看！

演讲嘉宾：Saleel Awsare / Synaptics 全球副总裁兼语音和图像部门总经理 演讲主题：语音、图像、生物识别，人机交互领域的技术趋势和最新应用

作为一家致力于人机交互界面厂商，Synaptics 致力于交互技术的革新和应用

借助下一代环境感知语音 AI，智能设备将得到革命性发展

环境感知语音 AI 在家庭、办公、车载、动态（On The GO）等场景下的应用

在 Synaptics 现有的语音、图像、生物识别等人机交互技术基础上，打造出真正的沉浸式语音界面

Q&A

演讲嘉宾：Saleel Awsare / Synaptics 全球副总裁兼语音和图像部门总经理
演讲主题：语音、图像、生物识别，人机交互领域的技术趋势和最新应用