苹果(Apple)公司的新版Siri由云端定制的谷歌Gemini模型(Google Gemini)驱动,原本应该运行在苹果芯片(Apple silicon)上——至少iPhone制造商不久前是这么保证的。

NVIDIA-GB200-NVL72-AMD-scaled.jpeg

然而,苹果一直难以在其自有服务器上容纳谷歌(Google)那个庞大的模型,迫使这家总部位于库比蒂诺的科技巨头求助于基于英伟达(NVIDIA) GPU的权宜之计,以至少维护其隐私信誉的一丝尊严,同时将支持新版SiriGemini模型托管在谷歌的服务器上。

苹果不得不将支持新版Siri的庞大模型托管在谷歌服务器上以获得最佳推理性能,并且似乎将英伟达B200 GPU内置加密功能作为隐私相关的权宜之计。

我们已知,即将推出的聊天机器人风格的Siri将利用一个更先进版本的谷歌Gemini模型,内部称为苹果基础模型第11版(Apple Foundation Models version 11)。据Gurman透露,该模型预计可与Gemini 3竞争,且比支持改进版Siri的模型强大得多。

与此同时,苹果还通过一种称为蒸馏的技术训练一系列较小的设备端模型,这使得这些学生模型具备其教师模型(即经许可的谷歌Gemini模型)所拥有的部分能力。

然而,考虑到谷歌定制的Gemini模型拥有数万亿参数,苹果一直难以将其容纳在其专用服务器网络私有云计算(Private Cloud Compute)中。因此,对于新版Siri的某些用户请求,将直接由谷歌云(Google Cloud)中的许可Gemini模型处理,以确保最佳推理性能。

现在,The Information发布了一篇有趣的报道,指出苹果倾向于在谷歌的服务器内部署英伟达B200 GPU,尤其是在这些GPU配备了内置加密功能的情况下,该功能可在数据处理时对数据进行加密。

英伟达宣称,该功能可保护部署在RubinBlackwellHopper GPU上的AI模型的机密性和完整性,同时使敏感的AI工作负载能够以接近原生性能在共享或云端环境中安全大规模运行。

这一举措应有助于苹果向用户保证,他们的数据不会被谷歌窃取,在当前现实条件下构成了最佳妥协方案。


文章标签: #AI #Siri #苹果 #谷歌Gemini #英伟达GPU

负责编辑

  菠萝老师先生 

  让你的每一个瞬间都充满意义地生活,因为在生命的尽头,衡量的不是你活了多少年,而是你如何度过这些年。