Uploads%2farticles%2f16417%2fapple events   apple 0001
|
2024-06-11

苹果 AI 重磅登场:Siri 全面进化,自有模型,内挂 GPT-4o,私密云计算定义 AI 隐私标准

国行 iPhone 16 Pro / Pro Max 值得期待吗?

WWDC 24 上,苹果终于发布了自己的 AI。

秉承了一贯「不蹭热词」风格,又有些讨巧的,苹果为自家 AI 起了个响亮的名字——Apple Intelligence,所以简写还是 AI。

Apple_Events_-_Apple-0021

库克简短导入,阐述了苹果在各个终端产品中引入人工智能和机器学习的几个核心原则:

  • 必须足够强大;

  • 必须直观易用;

  • 必须深度整合到产品的使用体验中;

  • 必须能懂你,并以你的个人情境为基础,比如日常安排、人际关系、沟通交流等;

  • 必须从设计之初就注重隐私保护。

Apple_Events_-_Apple-0019

苹果公司软件工程高级副总裁 Craig Federighi 做主要发言。

他为 Apple Intelligence 做了定义:它是个人化的智能系统,将让你手中的个人化产品更实用、更称心。

接下来他和他的团队从能力、架构、体验三个方面,详细介绍了 Apple Intelligence。我们也将在正文中逐项为你展开。

几点说明:

差异性:目前市面上不乏一些让人眼前一亮的聊天工具,它们能利用全世界的知识来执行大量的任务,但很少能充分了解你或你的需求。而 Apple Intelligence 更强调个人化、对于个性需求的理解。

深度集成:Apple Intelligence 集成了苹果大型语言和扩散模型,可以嵌入至新系统 iOS 18、iPadOS 18、macOS Sequoia 之中,并能够根据你的个人情境来提供智能协助,而且实用性、相关性都很高。

隐私保护:它在每个环节都注重隐私保护,并深度整合到苹果的各个平台、以及 app 中。对于日常任务,Apple Intelligence 可以本地设备端运行处理。对于复杂任务,苹果则构建了基于芯片层的私有云,在大算力支持的情景下,来保证数据隐私。

设备要求:虽然 Apple Intelligence 免费,但对硬件设备要求很高,仅适用于 A17 Pro 芯片的 iPhone 15 Pro / Pro Max 以及配备 M1 芯片或更高版本的 iPad 和 Mac。。

上线时间:受限于语言、地域、政策等因素,Apple Intelligence 先期仅在美国市场开启试用,秋季为用户提供测试版。

国行版是否值得期待:至于其它地区,苹果仅给了这样的参考信息:另外一些功能以及其他语言和平台的支持将在明年陆续推出。

开发者利好:最后还不忘向开发者高呼,苹果更新了 SDK、开放了 API,大家赶紧拥抱 Apple Intelligence 吧!

01 能力

Apple Intelligence 的功能强大,可以让 iPhone、iPad 和 Mac 理解并生成语言和图像,还能代你执行操作,简化跨多个 app 进行交互的过程。

它的真正独特之处是能理解你的个人情境。Apple Intelligence 内置的大语言模型能深刻理解自然语言,让日常生活中的各种大事小事都做得更快、更轻松。

比如,iPhone 可以根据你的个人情景,为通知设定优先次序,减少不必要的干扰的同时,又不会错过重要消息。

Apple_Events_-_Apple-0055

码字时,Apple Intelligence 能够帮你重写、校对、提取文字摘要、提炼想法、检查段落。

rewrite

这些新功能将自动支持邮件、备忘录、Safari 浏览器、Pages 文稿、Keynote 讲演、以及第三方 app。

Apple_Events_-_Apple-0026

除了语言 AI 之外,Apple Intelligence 还具备图像 AI 功能,让照片、表情符号和动图有了新的视觉表达方式,并且支持图像生成功能

它能识别照片图库中的人物,比如,当你向朋友发送生日祝福时,AI 可以生成一张朋友的图像,再用蛋糕、气球和花朵来点缀。

wishes_for_birthday

再比如,你想告诉妈妈她是你心中的超人,就可以发送一张她身穿披风的照片。

Apple_Events_-_Apple-0027

生成的图像有三种独特的风格可选:素描、插图和动画风格。

3_styles

这种体验对于系统中的所有 app 都适用,比如备忘录、无边记、Keynote 讲演、Pages 文稿。

Apple_Events_-_Apple

接下来介绍的是跨多个 app 执行操作的能力。

类似调出某个时间段的文件、查看某些人的照片、播放某一天接收到的播客,等等。Apple Intelligence 能实现数百种此类操作。

要做到个人化智能就要深刻理解个人情境。能够理解个人情境,才能提供真正实用的智能技术。

Apple Intelligence 的运作基于个人信息和情境,不仅能从你的各种 app 中检索和分析相关程度最高的数据,还会参考你屏幕上的内容(比如你正在查看的邮件或日历日程)。

Apple_Events_-_Apple-0029

比如我有一场会议改到了傍晚,而我想知道开完这场会之后,我还能不能赶上女儿的演出,Apple Intelligence 就会处理相关的个人数据,来为我提供协助它知道我的女儿是谁,以及她几天前发来的演出详情,也知道我这场会议的时间和地点,并能预估我从公司到剧院的交通状况。

daughter

02 架构

所以,问题来了,隐私和安全。人们不应需要交出所有生活细节,并储存到他人的 AI 云端加以分析。

在介绍 Apple Intelligence 的隐私保护之前,我们先了解一下它的架构。

苹果的个人化智能系统基于设备端处理,Apple Intelligence 必须深度整合到 iPhone、iPad 和 Mac 以及各款 app 中,让它能够识别你的个人数据,而无需收集这些数据。

Apple_Events_-_Apple-0032

要实现这项功能,首先离不开苹果独特的软硬件整合、以及多年对芯片的投入。包括 A17 Pro 以及 M 系列芯片,为驱动 Apple Intelligence 提供了坚实的算力基础。

Apple_Events_-_Apple-0033

其次,超强的大语言模型和图像生成扩散模型能飞快根据你当前的活动进行调整。

它还内置设备端语义索引,可以整理和提炼你各种 app 中的信息。当你提出请求,它会通过语义索引来识别相关的个人数据,并传输给生成式模型。

%E6%A8%A1%E5%9E%8B

尽管大多数模型都能完全在设备端运行,但 Apple Intelligence 不仅发生在设备端,但做法则与普通 AI 不同。

当你用到的模型大到无法放进随身携带的设备时,就需要服务器端的处理能力了。通常情况下,服务器还会储存你的数据,并且未经你同意就使用这些数据,因为服务器软件只有其所有者才能访问,即使某家公司否认滥用你的数据,你也无法验证情况是否属实。

苹果却能做到让你全权掌控自己的数据,包括在哪里储存、谁能访问。

iPhone 上的软件映像能够持续验证它的隐私性,将 iPhone 上的隐私与安全保护功能扩展到云端,从而解锁更多智能功能。

Apple_Events_-_Apple-0031

苹果重磅发布了 Private Cloud Compute 这一私密云计算技术,赋予了 Apple Intelligence 更多灵活性,让它能扩展自身的计算能力,并引入更大的基于服务器的模型来处理更复杂的请求,同时妥善保护你的隐私安全。

此类模型将在为苹果芯片特别打造的服务器上运行,它能够提供与 iPhone 相同的芯片级别的隐私和安全保护。

苹果还借鉴 Swift 编程语言的安全特性,并明示软件的透明度。Apple Intelligence 会分析你发出的请求能否在设备端运行,如需更强的计算能力,便可借助 Private Cloud Compute 将仅与任务相关的数据发送给苹果芯片服务器处理。

Private_Cloud_Compute

苹果承诺,你的数据绝不会被储存,连苹果也无法访问,它只会被用来执行你的请求。独立专家可以检查这些服务器运行的代码,以验证隐私安全是否得到保障。

Apple_Events_-_Apple-0034

此外,Private Cloud Compute 通过加密形式,让 iPhone、iPad 和 Mac 还具备拒绝与服务器对话的功能,除非这个服务器的软件具有已接受检查的公开记录。

苹果此举为 AI 隐私设立了全新标准,带来了让人放心的智能技术。

03 新体验

接下来将介绍在 Apple Intelligence 的赋能下,各种 app 及其使用体验的变化。

其中问世 13 年 Siri 实现了最大的能力飞跃,还有各种强大的写作和沟通工具,以及一些趣味视觉表达方式,这些体验将贯穿在 iOS 18、iPadOS 18 和 macOS Sequoia 中。

Siri 全面进化:能力更强、更个性化,支持 ChatGPT 4o 扩展、Gemini 排队中

首先是 Siri 全新的外观,它与系统的整合更加紧密。

当 Siri 运行时,不再是屏幕底部出现的「小球」,而是以特制的光晕环绕整个屏幕边缘。

new_siri

除语音交互之外,Siri 还新增了文字输入的交互方式。语音 + 文字,亦可配合使用,与之交互。

Apple_Events_-_Apple-0035

能力上,Siri 能够理解更复杂的语言,即使对话不连贯,甚至出现错词,它都能对答如流。

比如,当你询问天气说错地名时,Siri 会纠正错误地名,而给出正确地名的天气信息。

对上下文理解能力的提升,也会让 Siri 更加聪明。

比如,你可以模糊的让 Siri 帮忙创建日程,它仍会按照上文提及的地名自动创建。

Apple_Events_-_Apple-0038

Siri 还可以充当日常使用苹果智能的小助手,帮助你学习和使用新功能。

比如,你写好了一条短信,但是想要明天发给朋友。这时,就可以询问 Siri 该如何操作,它会分步骤的告诉你,可以采用新上线的「稍后发送」功能。

Apple_Events_-_Apple-0040

Apple Intelligence 还为 Siri 带来了屏幕内容感知功能,它能理解屏幕上的内容,并执行相应的操作。

比如,当朋友发消息告诉你新地址时,就可以直接在信息对话界面调用 Siri,让它将地址信息添加至朋友的联系人名片中。

on_screen_awareness

Siri 也会理解不同 App 中的多样操作,利用全新协调功能,跨 App 执行更为复杂的命令。

Apple_Events_-_Apple-0042

比如,让 Siri 在相册应用中找出某张照片后,添加到备忘录应用的某个文件内。

search

按照会上苹果的意思:

我们希望 Siri 能穿梭于系统中,随时听你差遣。

Siri 还是一个找东西的好帮手。

比如,当你忘了资料是在邮件、信息,还是备忘录里时,只需要告知 Siri 资料信息,它就能帮你在应用中找到。

search-1
Apple_Events_-_Apple-0045

最后,苹果借用了一个案例,进一步强调了 Siri 的个人情境感知能力。

Siri 能够在邮件中,获取通信双方涉及的航班信息、就餐地址,帮助用户规划接机、前往就餐行程安排。

Apple_Events_-_Apple-0046
Apple_Events_-_Apple-0047
Apple_Events_-_Apple-0048

对于创作、知识问答、多模态交互等 ChatGPT 4o 更擅长的领域,苹果借助 Siri 开放了对其的支持与调用。

苹果无需注册 ChatGPT 即可享受这一功能,而如果已是 ChatGPT 订阅用户,也能关联账号,体验付费功能。

Apple_Events_-_Apple-0066

对于隐私,苹果表示所有步骤操作均需用户授权,同时数据不会用于训练与记录。

而在会后的采访环节,Craig 透露:

我们认为,用户会选择使用他们喜欢的大模型,因此我们期待未来与谷歌 Gemini 等不同模型合作集成。虽然现在还没有要宣布的,但这是我们的方向。

文本和图像生成:自动撰写、文本润色、快速摘要、录音转写、表情包、图像生成、自动生视频

Apple Intelligence 主要通过「书写工具」、「智能回复」、「邮件预览」功能,来提升应用的实用性。

其中「书写工具」为全系统适用功能,在邮件应用下,则主要利用了当中的「重写功能」。

它会在回复邮件时,提供写过的不同版本内容,方便用户选出满意的一版。

1-rewrite

并且,「重写功能」还能直接在邮件的行文中,给出调整语气、措辞、语法选项,甚至可将文本内容生成为一首小诗。或贴心的在长邮件开篇,添加经过提炼的摘要内容,以方便收件人阅览。

2-rewrite
3-rewrite
summarize

「智能回复」功能,可以快速识别收件核心内容,并提供必要的回复选项建议,用户只需确认回复内容,无误后即可发送回复邮件。

smart_reply

而对于邮箱内繁多的未读邮件,「邮件预览」功能可将邮件内的重点信息摘录置于预览界面,不用逐条打开,也能快速获悉邮件内容。此外,苹果还将 Priority Messages 移至上方,Apple Intelligence 即能够读懂紧急邮件,并将其置顶显示。

Apple_Events_-_Apple-0053
Apple_Events_-_Apple-0054

对通知应用进行更新,优先通知会显示在叠放内容的顶端,一览需要注意的事项。

具体通知界面还会显示摘要,以便快速扫视。即使有群消息弹出,锁屏界面下,依旧能清晰获悉。

首要通知

此外,通知应用新增了全新的「专注模式」,通过对通知内容的理解,只选出紧急性通知,从而减轻通知对用户的干扰。

Apple_Events_-_Apple-0056

苹果对于表情包可谓情有独钟,此番则带来了生成式表情包 Genmoji。

只需在聊天时,键入简单的文字描述,设备端侧即可生成应景的表情包。

genmoji

Genmoji 还带有多种生成方式,比如可以依照相册里的人物,选中创建神似的 Genmoji。

Apple_Events_-_Apple-0057

Image Playground 是一款内置在信息、Keynote、Pages、无边记等应用中的生成式图片工具。

它提供主题、服装、配饰、地点等类别选项,选中的内容就会加入至 Playground,无需提示词,也能生成图片。

PL

由于选项的预设,Image Playground 可以完全在设备端生成。

apple_intelligence

如果对于图片有具体想法,也能采用输入文字描述的方式,将其添加至 Playground,进而通过云端生成图片。

apple_intelligence

值得一提的是,Image Playground 也能够基于信息对话的上下文信息,给出生成图片的建议。

除内置工具形态外,Image Playground 将作为原生新应用出现,以方便用户生成图像与社交网络分享。

Apple_Events_-_Apple-0060
Apple_Events_-_Apple-0061

备忘录应用引入了新工具 Image Wand,它能将笔记草图转换成精美图片,为笔记锦上添花、图文并茂。

Image Wand 内置于工具调板中,并可配合 Image Playground 互动使用。

比如,在笔记中圈选出草图,打开 Image Playground,Image Wand 就能基于建议的文字、图片信息,创建逼真的图像。

apple_intelligence

相册应用新增了清除工具,可以识别出照片背景中的干扰物体,进而消除。

clean_up

搜索照片、视频在 Apple Intelligence 的加持下也变得更方便。

Apple_Events_-_Apple-0062
Apple_Events_-_Apple-0063
Apple_Events_-_Apple

并且,相册还支持创建「回忆」影片,可以根据特定限制词,智能挑选出对应照片,并生成具有主题、章节的影片内容。

Apple_Events_-_Apple

录音应用也支持摘要功能,并扩展至电话应用。

Apple_Events_-_Apple-0064
Apple_Events_-_Apple-0065

04 小结

在最近的一次财报会上,苹果公布了 iPhone 的销售情况,今年 1 月~3 月 iPhone 销售额同比下降 10%,成为自 2020 年夏天以来最大的降幅。

如今发布的 Apple Intelligence,打出了一套嵌入系统底层、跨应用的 AI 组合拳,还有智能的 Siri、生成式表情、生成式图片、书写工具等等使用 AI 应用上线,并且作为免费增值应用向消费者提供。

势必都将提升 iPhone 产品力,将消费者目光重新拉回至 iPhone。

Apple_Events_-_Apple-0067

但是,Apple Intelligence 的引入,也存在着一些问题。

比如 Apple Intelligence 仅可在搭载 A17 Pro 芯片上的 iPhone 15 Pro 和 iPhone 15 Pro Max 上运行,如果机制不变动的话,一定程度上会扰乱当前的 iPhone 销售周期。消费者完全有理由,等到 9 月购买 iPhone 16 进而去体验 Apple Intelligence。

此外,苹果对于 Apple Intelligence 其它国家地区的上市计划并不明朗,本地化、隐私都将是苹果需要处理的问题。


主笔:达达、周森 / 深圳湾

审校:周森 / 深圳湾

编辑:陈述 / 深圳湾

>>
Back to top btn