库克最体面的告别,是把舞台留给了 Siri AI
湾里湾外汇编:Meta 刚刚推出了一款生成式语音工具 Voicebox,可用于执行语音编辑、降噪、采样和风格化等多种任务。具体功能包含:
- 上下文中的文本到语音:使用短至 2s 的音频样本来进行风格匹配,并用于文本到语音的生成;
- 语音编辑和降噪:通过重新创建被噪音「污染」的部分语音或者替换发音错误的单词,从而实现编辑和降噪效果
- 跨语言风格转换:给定某人的演讲样本以及文本(支持部分语言)后,可以生成文本语言对应的风格化语音。需要注意的是,文本的语音目前仅支持英语、法语、德语、西班牙语、波兰语以及葡萄牙语,而演讲样本和文本的语言可以是不同的语言(参考此前深圳湾的报道:将 ChatGPT 装进了口袋,这款穿戴产品有摄像头、能投影到掌心、交互用对话)
- 多样化的语音采样:从不同的数据中学习后,Voicebox 可以生成更能比拟人们在现实生活中的说话的语音
Meta 称 Voicebox 是 Meta 在生成式 AI 研究上迈出的重要一步,未来可以用来帮助创作者轻松编辑音频、允许视障人士用他们的声音听到朋友的文字消息、并使人们能够用自己的声音说任何外语。

