Uploads%2farticles%2f13135%2fnkujbxt9jwgecefogwsx

行业观察 |

2019-05-08

Google I/O 2019：AI 往实用性的道路前行，少了黑科技依旧精彩

AI 让世界充满爱

林亿

北京时间 5 月 8 日凌晨 1 点，Google I/O 大会在美国山景城海岸线圆形剧场（The Shoreline Amphitheatre）举行。

今年已经是 Google 落实「AI First」的第三个年头，在这个标志性大会上，Google CEO Sundar Pichai 例行登台开场，他表示，一直以来，Google 的目标是组织来自全世界的信息，帮助全球用户都能轻松的访问。

而接下来，Google 将从一家「帮你找到答案」的企业，变成一家「帮你完成任务」的企业，为大家创建一个对每个人都更能有帮助的 Google。

整场 I/O 大会下来，没有「黑科技」多少让人有些失望。不过，整场大会的格调也十分契合 Sundar Pichai 开场白，AI 在 Assistant、Android Q、AR、硬件等 Google 的重要业务上，都起到了润滑的作用，并向着「实用性」的道路靠拢。

1.AI
视觉、语音

首先在 Google 的立身之本——搜索方面，在 AI 的帮助下也迎来重要更新：视觉搜索引入 AR 功能，将搜索到的结果以 AR 的形式直接展示在现实当中。

搜索：视觉搜索引入 AR 功能

在会场上，Google 就将搜索到的大鲨鱼「投射」到现实场景。

Google 该项功能已与 NASA，New Balance，Target，Visible Body，Volvo，Wayfair 等达成合作，在搜索或者实物扫描中支持建立 AR 模型。

例如，在 Google 搜索中查看来自 Visible Body 的解剖学 3D 模型，可提供学习参考。

以上以及 Google Lens 其实都体现了 Google 在机器视觉技术方面的进展。此次 Google Lens 有了如下的更新：

更强的菜单识别：扫描一家餐馆的菜单，Google Lens 能自动用符号凸显其中最受欢迎的菜肴，用户点击后还会显示其他用户对这道菜的评价以及评分，帮点单选择困难户做出选择。

实时拍照翻译。相当于把 Google 翻译应用上拍照功能搬到相机上，将镜头置于车票或者菜单上，翻译结果将自动覆盖之上。

将数字化信息与物理世界中的事物联系起来。例如，在 Google 合作的 Bon Appetit 上，用相机指向杂志的菜谱，手机便会演示这道菜的制作过程。又或者应用在博物馆当中，相机指向画作便能显示相应的历史故事。

文字识别转语音朗读。例如，在对准报纸、宣传页，手机可支持逐句标注，并且以你熟悉的母语朗读上面的内容。

Google 计划让该功能已支持英语、日语、中文等数十种语言，同时，它的代码容量仅 100KB 左右，因此使用门槛很低，低至 35 美元的终端设备也能使用。

以上 Google Lens 更新的功能都能在最新的 Android Q 中应用。

Google Assistant：引领下一代语音助理

作为 Google 的语音助手，Google Assistant 不管是在安卓智能手机，还是在智能音箱以及其赋能的第三方硬件中扮演着重要角色。目前，Google Assistant 的装机量已经累计超过了 10 亿台，与全球合作的智能设备覆盖了 3500 多个品牌的 30000 个种类，在 80 个国家/地区提供 30 多种语言。

在此次大会上，Google 表示，他们打造出了「next-generation Assistant」，而经过内部的努力，Google Assistant 在响应速度、处理多个任务等方面的能力取得了重大进展。

基于 Google 的神经网络和机器学习算法，Google Assistant 的 100GB 语音识别模型在运行中所占据的字节不到 0.5 GB，使得在理解语音和提供结果的速度比前代的速度快了 10 倍，并且可在手机本地运行。Google Assistant 的未来愿景是实现无网络化（本地处理）、零延时。

新一代 Google Assistant 具备连续快速处理多个任务的能力。在现场演示环节，Google 发言人连续利用手机上的 Google Assistant 执行浏览照片、设置计时器、打开手电筒、预定网约车等多可任务，期间表现非常流畅、一点也不卡顿，并且不需要用「hey Google」唤醒助手。

还有就是，以后 Google Home 闹钟到点叫床的时候，你只要喊一句「Stop」就能制止闹铃。

另外一项演示中，发言人通过语音命令的方式用 Google Assistant 完成一封邮件的撰写和发送，又快又准，并且 AI 在根据语音转写邮件的过程中能自觉预测下一个词句。

「Picks for you」个性化推荐的能力。基于过去对话知识图谱，Google Assistant 能够更快、更准确的理解用户的意图和需求，以及所说的特定词语代表着什么，提供精准的个性化推荐。今年晚些，该功能将会在食谱、博客、活动等应用得到体现。

场景化的「驾驶模式」，这是新一代 Google Assistant 在驾驶场景的探索。通过「Hey Google, let’s drive」的语音指令后，Google Assistant 带来全新的信息仪表盘和个性化功能，包括来电告知联系人信息、询问是否接听，恢复上回暂停的博客、根据日历上的餐厅预定信息，自行导航到目的地等。

Duplex AI：搬上 web 端

去年首次亮相的 Duplex AI 在惊艳过后，现已经能够接听来电骚扰，并且在美国的 43 个州为个人用户提供预定餐厅的服务。

时隔一年，Duplex AI 再迎来更新：把打电话业务能力转移到网页 web 端。比如网上租车、买电影票，只要你告知需要预定哪个商家的某个服务，剩下的交给 Assistant 来自动帮你到网页上自动填充个人信息即可。

Project Euphonia：让 AI 理解每个人

目前，大量语音识别技术的训练只针对语音表达正常的人，而对许多特殊群体，比如失语者（渐冻症 ALS）的理解是欠缺的。Google 此次发起了 Project Euphonia 的新项目，想在这方面做一些努力。

Project Euphonia 的项目旨在获得这类特殊人群的机器学习模型，训练出更具包容性的语音理解模型。Google 希望让所有语音互动设备都能理解和服务每一个人。

2.Android Q

在会上，Google 宣布，目前搭载 Android 系统的活跃设备数量超过了 25 亿台，并强调了 Android 的三大核心主题——创新、安全与隐私、数字健康。

如此前爆料，Android Q 正式提供黑暗模式（Dark Mode），更省电。

隐私方面，Android Q 新增 50 个隐私和安全设定，用户可设置应用在使用期间是否能够访问位置等信息，以及允许访问的时间段。同时，系统也会主动通知用户哪些应用正在后台收集资料等。

另外，为了隐私考虑，Google 将 Chrome 过去一直使用的隐身模式 Incognito mode 应用到了 Google Maps 和 YouTube 上。

伴随新一代操作系统，Google 在去年演示的 Google Maps 实景+AR 导航的功能终于上线。

基于 On-Device 机器学习，Google 推出了 Live Caption 功能，该功能够在视频中根据音频转化为文字实时显示在屏幕上。有了这一功能，尤其对于听障用户来说，观看视频变得方便多了，而且重点是它还能够离线使用。Google 官方还表示，即使关掉视频声音，文字照转不误。

另外，Google 还推出了 Live Relay 的功能，该功能支持离线情况下将对方语音实时转成文字，帮助听障用户打电话。

新增专注模式（Focus Mode）。去年，Android P 首次加入了防沉迷系统，这次的专注模式则避免了前者「一刀切」的情况，为用户提供更智能、灵活的屏蔽管理。在你认真工作的时候，你可以选择屏幕一些容易让你分心的 APP。

迎合折叠手机和 5G 的未来趋势，Google 还展示了 Android 的折叠交互体验。

最后，Google 公布了 Android Q 的首批合作厂商，国内的华为、小米、一加、OV 均在名单页上。

3.硬件
带摄像头的智能音箱、低价的手机

在会上，此前爆料的两款硬件 Home 智能音箱、Pixel 3a 系列中端手机正式发布。

Nest Hub Max：广角镜头、人脸手势识别、立体声

此次新推出的带屏智能音箱名称为 Nest Hub Max，顾名思义，Google 将 Nest 搬上了音箱，弥补去年 Home Hub 没有摄像头的遗憾，并且增大了屏幕尺寸。Google 表示，让房屋成为一个「helpful home」是他们打造这一新产品的主要推动力。

Nest Hub Max 的外观完整的继承了上一代产品，相当于一个大号的 Home Hub，拥有更大的显示屏（10 英寸）、更好的音质（立体声）、配备广角摄像头，能实现视频通话、安全监控、拍照、菜谱、家居控制等其他同类产品相同的功能，已经具备对标亚马逊 Echo Show 以及 Facebook Portal 的完整能力。

为了体现 Nest Hub Max 这款产品的独特性，Google 的演讲重点也同样放在了其 AI 能力上：

Face Match 功能识别人脸能进行身份认证
127° 广角镜头支持跟踪用户，使得视频通话中用户保持在画面正中间
手势识别暂停音乐、视频播放。

对此，Google 再次强调，Face Match 人脸识别功能并不依赖云端，而是在本地运行，以消除大家对隐私保护方面的顾虑。

Nest Hub Max 售价 229 美元，预计今年夏季率先在美国上市。

Pixel 3a 系列：低价的好相机

传闻中的 Google Pixel 系列的中端机型 Pixel 3a 也在本次大会上亮相，售价 399 美元起，相当于去年 Pixel 3/ 3 XL 价格的一半。官方表示，Google 拥有那么多强大的 AI 技术，也更希望能让更多人以更低的价格享受到这些 AI 带来的便利。

Pixel 3a/ 3a XL 完整延续了 Pixel 3 系列的设计风格，提供黑、白、紫三种颜色，保留了 3.5mm 耳机插孔、Active Edge。另外，Pixel 3 依托 AI 的夜拍增强功能、人像模式景深调整均在这部机上得到了保留。

Pixel 3a/3a XL 分别配备容量为 3000 mAh 和 3700 mA 的电池。得益于的 Google 的机器学习，Pixel 3a/ 3a XL 的续航得到了有效的管理，充电 1 小时续航长达 30 小时，15 分钟快充能获得 7 小时的使用时长。

其他配置、功能方面：

芯片：高通骁龙 670
系统：Android Q
屏幕：Pixel 3a 配备 5.6 英寸 OLED 屏，2,220 x 1,080 分辨率，441 ppi；Pixel 3a XL 配备 6 英寸 OLED 屏，2,160 x 1,080分辨率，401 ppi
摄像：前置 800 万像素，后置 1220 像素摄像头；支持 Top Shot，Motion Auto Focus，Super Res Zoom，Night Sight 和 Photobooth 模式
运存、存储：4GB、64GB，不支持外部扩展。
价格：399 美元/479 美元

过去 Pixel 3 只在 Verizon上独家销售，这次的 Pixel 3a 系列则进一步拓展了 T-Mobile，Sprint 和 US Cellular 等运营商的销售渠道。目前，Pixel 3a 支持在美国等 13 个国家和地区销售。