影石 Insta360 智能 4K 网摄像头 Link2 上市,AI 加持、让视频会议更简单
垂直场景的全栈式创新:VINCI 的「问题解决」之道 | WARE 2017
VINCI 发现和尝试解决的问题,是「在 On-the-go 场景下如何让人与信息连接得更紧密」。
当语音智能作为一种新的技术手段和交互方式兴起时,如何恰当地将新技术与产品结合、为产品增色,是许多硬件厂商思考的问题。对于各式各样的硬件产品,如果只是千篇一律地加个语音控制,语音和智能结合的优势其实并没有真正被发挥。
在「WARE 2017 语音智能平台与应用峰会 第 II 季」的专题演讲中,VINCI 创始人朱大卫以打造 VINCI 智能头机的经验回答了这个问题,他认为,技术的应用必须放到具体的垂直场景下,发现和选定一个存在问题和痛点的独到场景之后,尝试从不同的角度、围绕问题的解决进行「全栈式」的创新,具体技术的应用是这个以解决问题为目标的过程的一部分。
VINCI 发现和尝试解决的问题,是「在 On-the-go 场景下如何让人与信息连接得更紧密」。
朱大卫首先界定了「On-the-go」场景的定义:「On-the-go 跟我们说的 mobile(移动)场景有点不同,on-the-go 强调身体处在动态下,比如跑步、上下楼梯等手和眼睛都在被占用的情况,翻译成『动态场景』会贴切一些。」
一个典型的 On-the-go 场景,就是在跑步时听音乐,这个场景也是让朱大卫注意到 On-the-go 场景痛点的契机。「我们过去跑步听歌的解决方法,需要把手机耳机等多种设备手动连接,需要多次手动点击屏幕去寻找想听的歌曲,同时,这些操作还会打断会正在进行的运动。这是因为过去 On-the-go 场景听歌体验的核心在于手动型交互。」
VINCI 解决这一问题的思路,是以软硬一体的方式,打造一个全面的解决方案。具体来说,包括硬件上独立的声音计算设备,内容上云端直达的服务,以及交互上的语音对话式交互。
硬件上之所以选择做一个独立于手机等外部音源的一体机,朱大卫说,主要是考虑了三方面的原因。
一是避免 On-the-go 场景下常见的设备受限的问题,例如跑步时不便带手机,航班上不能使用手机等等;二是解决设备之间连接不方便的问题,不会再有恼人的耳机线,也不会存在蓝牙等无线连接不稳定的情况;三是解决声音输入到输出不匹配的问题,主要指的是不同场景下设备的适用性。
基于硬件独立的概念打造的 VINCI 智能头机,可通过 3G 或 WiFi 连接网络,具备播放解码耳放一体化的能力,同时支持地铁、飞机、走路、骑行、家庭、办公等多个场景的针对性降噪,1.5 版本还能够实施将 2D 的 MP3 转换为 3D 音频,增强沉浸感。
内容上,VINCI 试图基于人工智能让云端音乐随时匹配用户的动态,这比过去的协同过滤音乐推荐算法更进一步,将心率、运动传感等更多维度的数据纳入用户状态画像的构建中,从而不仅仅是推荐符合个人口味的音乐,而能够匹配用户的瞬时状态来进行主题歌单式推荐。
朱大卫说,VINCI 在内容方面的下一步目标,是让音乐内容更加丰富,匹配更加动态、瞬时,隐形算法更加显性化,「打造更懂用户的音乐 AI 陪伴电台」。
在讨论的重点,语音对话式交互上,朱大卫强调,「深度学习+自然语言理解的对话式音乐服务将成为解决 On-the-go 场景听歌问题的核心。」
目前,VINCI 已经支持语音控制,直接点歌,以及特定音乐场景的简单对话聊天。此外,VINCI 还深入中英文音乐领域,对高频中英文歌曲的混合识别进行了针对性的优化。
在基本的音乐服务之外,VINCI 还将在语音智能领域尝试 On-the-go 场景下的更多应用方向,如构建泛娱乐领域的知识图谱,接入符合 On-the-go 场景需求的泛服务等等。「在 VUI(语音交互界面)领域,我们才探索了很小的一段,抬头看路还很远。」朱大卫说,「比发明一个新事物更麻烦的,是把这个事情简单地传达出去,与用户和行业一起沟通产品。」
在此前深圳湾对朱大卫的采访中,他也曾提起过在传达产品概念时遇到的困难,但随着语音智能在行业中得到越来越多的关注,消费市场的接受程度也越来越高,语音智能产品被行业和消费者快速理解,得到行业和用户支持与共建的时代已经到来了。