垂直场景的全栈式创新：VINCI 的「问题解决」之道 | WARE 2017

Uploads%2farticles%2f11695%2fware 3232.001

2017-07-20

VINCI 发现和尝试解决的问题，是「在 On-the-go 场景下如何让人与信息连接得更紧密」。

当语音智能作为一种新的技术手段和交互方式兴起时，如何恰当地将新技术与产品结合、为产品增色，是许多硬件厂商思考的问题。对于各式各样的硬件产品，如果只是千篇一律地加个语音控制，语音和智能结合的优势其实并没有真正被发挥。

在「WARE 2017 语音智能平台与应用峰会第 II 季」的专题演讲中，VINCI 创始人朱大卫以打造 VINCI 智能头机的经验回答了这个问题，他认为，技术的应用必须放到具体的垂直场景下，发现和选定一个存在问题和痛点的独到场景之后，尝试从不同的角度、围绕问题的解决进行「全栈式」的创新，具体技术的应用是这个以解决问题为目标的过程的一部分。

VINCI 发现和尝试解决的问题，是「在 On-the-go 场景下如何让人与信息连接得更紧密」。

朱大卫首先界定了「On-the-go」场景的定义：「On-the-go 跟我们说的 mobile（移动）场景有点不同，on-the-go 强调身体处在动态下，比如跑步、上下楼梯等手和眼睛都在被占用的情况，翻译成『动态场景』会贴切一些。」

一个典型的 On-the-go 场景，就是在跑步时听音乐，这个场景也是让朱大卫注意到 On-the-go 场景痛点的契机。「我们过去跑步听歌的解决方法，需要把手机耳机等多种设备手动连接，需要多次手动点击屏幕去寻找想听的歌曲，同时，这些操作还会打断会正在进行的运动。这是因为过去 On-the-go 场景听歌体验的核心在于手动型交互。」

VINCI 解决这一问题的思路，是以软硬一体的方式，打造一个全面的解决方案。具体来说，包括硬件上独立的声音计算设备，内容上云端直达的服务，以及交互上的语音对话式交互。

硬件上之所以选择做一个独立于手机等外部音源的一体机，朱大卫说，主要是考虑了三方面的原因。

一是避免 On-the-go 场景下常见的设备受限的问题，例如跑步时不便带手机，航班上不能使用手机等等；二是解决设备之间连接不方便的问题，不会再有恼人的耳机线，也不会存在蓝牙等无线连接不稳定的情况；三是解决声音输入到输出不匹配的问题，主要指的是不同场景下设备的适用性。

基于硬件独立的概念打造的 VINCI 智能头机，可通过 3G 或 WiFi 连接网络，具备播放解码耳放一体化的能力，同时支持地铁、飞机、走路、骑行、家庭、办公等多个场景的针对性降噪，1.5 版本还能够实施将 2D 的 MP3 转换为 3D 音频，增强沉浸感。

内容上，VINCI 试图基于人工智能让云端音乐随时匹配用户的动态，这比过去的协同过滤音乐推荐算法更进一步，将心率、运动传感等更多维度的数据纳入用户状态画像的构建中，从而不仅仅是推荐符合个人口味的音乐，而能够匹配用户的瞬时状态来进行主题歌单式推荐。

朱大卫说，VINCI 在内容方面的下一步目标，是让音乐内容更加丰富，匹配更加动态、瞬时，隐形算法更加显性化，「打造更懂用户的音乐 AI 陪伴电台」。

在讨论的重点，语音对话式交互上，朱大卫强调，「深度学习+自然语言理解的对话式音乐服务将成为解决 On-the-go 场景听歌问题的核心。」

目前，VINCI 已经支持语音控制，直接点歌，以及特定音乐场景的简单对话聊天。此外，VINCI 还深入中英文音乐领域，对高频中英文歌曲的混合识别进行了针对性的优化。

在基本的音乐服务之外，VINCI 还将在语音智能领域尝试 On-the-go 场景下的更多应用方向，如构建泛娱乐领域的知识图谱，接入符合 On-the-go 场景需求的泛服务等等。「在 VUI（语音交互界面）领域，我们才探索了很小的一段，抬头看路还很远。」朱大卫说，「比发明一个新事物更麻烦的，是把这个事情简单地传达出去，与用户和行业一起沟通产品。」

在此前深圳湾对朱大卫的采访中，他也曾提起过在传达产品概念时遇到的困难，但随着语音智能在行业中得到越来越多的关注，消费市场的接受程度也越来越高，语音智能产品被行业和消费者快速理解，得到行业和用户支持与共建的时代已经到来了。

VINCI