深度特稿 |

2019-11-11

2019 真无线耳机发展划重点：传感技术和 AI 算法让 TWS 交互更智能

真无线耳机们变得「更好用」背后的故事

大树

当我们在讨论一个产品是否好用时，操作层面上的评估，往往要比性能参数之间的攀比，显得更为直接。

从用户的角度，无论是传统的物理按键，还是触控面板，或是时下流行的语音交互、手势交互，各种人机交互的操作方式，代表了用户与产品之间传递信息和交流的方式。这与人有关，更与人和物所处的场景有关。

从产品的角度，设备的感知能力的体现，不仅与其内置的各种声音、动作、甚至图像的传感器有关，更与这些传感器的处理能力、融合能力、以及针对特定设备、特定场景、甚至特定用户的协同能力有关。

本文中，我们就来聊聊，各家厂商如何利用各种传感器和 AI 技术打造加人性化的交互方式，让我们真无线耳机们变得更「好用」。

连接：芯片+系统的高度定制让「开盒即连、连接动画」成为可能

即便「开盒即连」存在一定的专利危险，但这是大势所趋，手机厂商必做。

连接是所有用户在使用真无线耳机的第一步，而第一步的操作流程的优化，给我们带来非常直观的爽感——在传统的蓝牙耳机上，我们在使用前基本都要经历「耳机开机--下载 APP-打开手机蓝牙--搜索蓝牙设备--连接」的过程。而在以 AirPods 为代表的真无线耳机上，我们打开耳机的充电盒就可以完成配对、查看电量信息等。

也正因此，即便面临着苹果的专利风险，「开盒即连+连接动画」依然成为了手机厂商出品的真无线耳机的标准配置。

而这种高度便捷性的即连即显体验的背后，得益于蓝牙私密协议、以及耳机与手机系统的深层捆绑基于蓝牙私密协议，以及各家手机系统的深度捆绑，手机在检测到耳机蓝牙信号后便可以自动手机上弹窗显示配对信息、耳机音量的等。

但同样因为这种深层定制，真无线耳机对主控手机品牌和系统的依赖性会远远高于有线耳机，如我们不习惯在安卓手机上使用 AirPods 一样，大多数手机厂商出品的 TWS 产品在遇到非自家品牌的手机时候性能都会大打折扣。

佩戴：红外/电容传感器让耳机知道什么时候该工作

想让耳机续航更长久，首先要知道用户到底有没有在用耳机

入耳检测同样是真无线耳机上非常常见的一种交互方式——摘下耳机自动停止播放、戴上耳机恢复播放。当前的真无线耳机入耳检测基本都是通过光电探测的方式，利用光学感应原理来感知用户的佩戴状态，光信号被阻挡代表耳机处于佩戴状态，系统便会自动进入播放模式，反之亦然。

除了光学传感器外，今年 8 月发布的 vivo TWS Earphone 采用了两颗电容式传感器，该传感器可以根据可根据电容变化进行入耳检测，避免了传统红外传感在受遮挡的情况出现误识别的情况，提升入耳检测的准确性，同时也降低了功耗。

动手：各种传感器打造的花式触控交互

在瘦长的耳机腿上，耳机厂商创造出了「按一按、点一点、挠一挠、敲一敲、捏一捏、捂一捂」等花式操作

在控制层，为了减少对手机的依赖，从有线年代开始，耳机厂商便会通过物理按键等线控等方式，让耳机上完成操作通话、音乐控制等操作。

这种操作一直延续到了真无线的早期阶段——在类似 Bose、铁三角、三星早期发布的真无线耳机上，耳机外侧基本都有一个以上的物理按键，以此来完成开关机、音乐控制等操作。

但由于物理按键体积大、密闭性和美观性也较差，现在的触控交互正从最开始的「按一按」变成了「敲一敲、捏一捏、点一点、挠一挠、捂一捂」等更加花俏的操作。

敲一敲：加速度传感器

没有物理按键和触控板的 AirPods，机身上的物理交互只好通过「敲一敲」来实现——依靠耳机内部的加速度传感器，AirPods 可以通过感知用户敲击耳机的次数来实现唤醒 Sir、切歌、接/挂电话等操作。

然而，这操作也并非百发百中，敲击姿势不对、动作不连贯性，AirPods 都用可能感受不到用户的命令。

捏一捏：压力传感器

大概是觉得敲击不够用了，在上月底发布的 AirPods Pro 身上，苹果加入了将原来的「敲一敲」变成了精确度更高的「捏一捏」。

AirPods Pro 的两侧耳机腿上各增加了一个力度感应器，基于此，用户可以通过「捏一下、捏两下、捏三下、长按」等操作来实现通话、音乐控制、降噪模式切换等操作。

点一点：触控板

除了各种传感器，点触交互的另一种实现方式是触控板和触控条。

比如，采用蚕豆式设计的索尼 WF-1000XM3 两耳的外侧均搭载了一块触控板，用户可以通过点触来实现日常控制：左耳点按实现「降噪、环境音、关闭环境音控制」的切换，右耳点按暂停/播放音乐，长按呼出手机的语音助手 Siri 等。

挠一挠：触摸条、电容感应

除了音乐控制、通话控制，用户对耳机交互最大的需求便是音量控制的。为此，出门问问 TicPods Free Pro、vivo TWS Earphone 等 TWS 均在耳机腿上增加了一个「滑动」控制，让用户可以通过滑动来调整音量等操作。

出门问问 TicPods Free Pro 采用的是触控板的方式，双耳侧面均搭载了一条触控板，以此来检测用户的滑动动作实现音量控制。需要注意的是，这种方式对触控条感应灵敏度、精确度有着极高的要求。

出门问问 TicPods Free Pro 「挠一挠」，其背后主要是通过两侧的触摸条来检测用户的滑动操作

而 vivo TWS Earphone 则通过电容感应的方式来检测用户触控及滑动操作，进而完成音乐控制、音量控制等操作。

Solutions Hub： vivo TWS Earphone 触控交互采用了 Goodix 汇顶科技 GH611 电容式入耳检测及触控 2 合 1 单芯片解决方案。GH611 集成了高性能、低功耗的 MCU 及自容感应前端电路，可根据电容变化进行入耳检测以及触控操作。

捂一捂：电容感应器

除了上面提到的按、摸、敲、捏等直接接触的操作外，索尼 WF-1000XM3 还进一步支持了「捂一捂」的操作——通过电容感应，当我们把左手捂在左耳面板上时，音乐音量会自动将降低，并把环境音级数开到最大，松开手之后恢复到自然状态。

点头：六轴传感器让耳机识别你的头部动作

不想接电话你就摇摇头，耳机会知道的

相较于上述几个需要动手的触控交互方式，本月初，出门问问的 TicPods 2 Pro 搭载了一项头部识别技术，把耳机上 Hand-Free 的想法执行得更加彻底。

TicPods 2 Pro 通过耳机内部的六轴传感器（3D 加速度计和 3D 陀螺仪）+出门问问自研的 TicMotion 头部姿态识别算法，可以识别用户的头部动作，当收到新来电时，用户可以通过点头或者摇头来实现接听、挂断电话。

Solutions Hub：TicPods 2 Pro 头部姿态识别背后，运用了意法半导体 LSM6DSO iNEM 惯性测量单元（IMU），它是一款整合 Always On 的 3D 加速度计和 3D 陀螺仪的系统级封装。

TicPods 2 Pro 的这一头部控制在初步的使用时，由于不熟悉在点头或摇头时依然会感觉有点别扭，但在骑行或者做饭等双手不便的场景下，这种交互模式的效率要远远高于触控。

动口：智能麦克风与 AI 算法让语音交互更简单

语音交互效率不断提升，让你能少说一句就少说一句

直接语音唤醒：低功耗芯片与算法、骨声纹识别

在过往耳机上的语音交互并没有办法实现真正的 Hand-Free——虽然很多 TWS 都宣称支持语音助手，但在使用时往往需要我们通过物理触控来激活语音助手，这也使得耳机端的语音交互显得格外鸡肋。

而随着低功耗芯片、低功耗算法的日渐成熟，今年发布的 AirPods 2、小米 Air 2、vivo TWS 1 等耳机都陆续加入了语音直接唤醒功能。

有苹果 H1 芯片加持的 Powerbeats Pro 同样支持「嘿 Siri」语音唤醒功能

这种操作进一步解放了我们的双手，也带来了误唤醒的问题。因此，语音唤醒也需要更加准备的唤醒词二次验证。

在一般的操作中，唤醒词的二次验证会被防止在手机端——当耳机听到唤醒词后会将音频信号回传到手机进行二次唤醒声纹验证，验证成功之后再出发手机上的语音助手，根据命令执行相应操作或调用相应的服务。

但这种手机端的二次验证链路长、反应慢，因此，像 AirPods、vivo TWS 等耳机，在耳机上加入语音加速感应器（微型骨振动传感器）——基于语音加速感应器，耳机便可以通过骨震动的信号来确认「主人」的身份，确保耳机只听佩戴者的命令，避免了在地铁上一个人喊「Hey Siri」全车厢的 iPhone X 都被唤醒的尴尬情况。

AirPods 2 的语音加速感应器与波束成形技术的麦克风协作，让 Siri 清楚知道谁在说话

离线热词：体积更小的边缘 AI 算法

在直接语音唤醒的基础上，小米 Air 2、出门问问 TicPods 2 Pro 等产品还加入了语音热词功能，将过往 TWS 语音交互中的触控唤醒、语音唤醒步骤直接去掉，通过「上一首/下一首、播放/挂断」等常见的语音指令来实现切歌等操作。

快捷操作：更精确的 AI 识别算法

除了热词唤醒，随着语音助手的进化，语音助手的交互流畅度也得到了进一步提升——举个例子，在打电话时，以前我们让语音助手帮忙打电话通常的流程是先唤醒语音助手，然后等语音助手回应之后再说出要打电话的指令，这个过程中需要停下来等语音助手反应。

而在现在的耳机上，比如（IQOO Pro+vivo TWS 1），当我们要打电话时，可以直接说「Hey Siri，给深圳湾的炫姐姐打个电话」即可，整个语音指令中间基本不需要停顿，更接近我们口语表达方式。

在这种一步直达的语音操作的基础上，用户还可以在手机上设置各种语音快捷指令，让语音助手执行多重任务。而这种语音指令的快捷程度和靠谱程度则依赖于各家语音助手与手机系统、云端服务的融合程度。

语音助手与手机系统、云端的集成程度在一定程度上决定了语音助手的聪明程度，比如在 IQOO Pro+vivo TWS 1 的组合可以直接播放微信信息，而 iPhone 11 Pro+AirPods 2 的组合就没有这种服务。

真·智能：环境自适应

随着越来越多的 TWS 加入降噪功能，耳机的常用交互操作中也需要增加一项降噪控制。如我们在刚刚发布的 AirPods Pro 上看到的，为了一个主动降噪功能，苹果将原来 AirPods 身上的「敲一敲」换成了精确度更高「捏一捏」。

除了苹果这种手动操作，类似索尼、小鸟音响等公司，也提供了更加自动的智能模式。

索尼 WF-1000XM3 的 SENSE ENGINE 支持自动检测用户活动状态，并切换至预设的环境声和降噪方案，实现智能降噪

其中，索尼 WF-1000XM3 搭载了「自适应声音控制」功能，利用耳机内部的 SENSE ENGINE 自动检测周边环境和用户状态，并自行切换切换到预设的环境声和降噪方案，实现个性化的智能降噪。

小鸟 Track Air+ SE 的智能调节功能可自动识别环境噪音大小、有风无风及佩戴者的运动状态，进而自动调节降噪到适宜的等级

小鸟音响自研推出了 CityMix Smart 智能降噪算法，耳机可以通过智能检测外接噪音及运动状态，自动调节降噪等级，或者自动开启器环境音增强等操作。

真无线耳机

智能交互

TWS

传感技术

深圳湾（微信公众号 ID：shenzhenware）是最早也是最活跃的硬件创新社区和媒体，关注「软件+硬件」带来的场景和交互创新，以及与平台和应用相连的产业链升级。

版权声明：本文系深圳湾原创，转载或摘录请先获得授权。
深圳湾微信公众号：shenzhenware。深圳湾同时在头条号、企鹅号、知乎等主流媒体站开设专栏板块，欢迎关注。转载、约稿、投稿、团队报道请在公众号对话框回复关键字并留下联系方式。

上一篇：专利显示 Apple Watch 将支持屏幕下指纹识别，可能用高通的方案

下一篇：健康、运动、时尚全面兼顾，三星 Galaxy Watch 8 卷出了新高度