苹果(Apple)已经构建了一个庞大而复杂的计算架构,为了掩盖其在人工智能方面的尴尬短板,甚至将谷歌(Google)英伟达(NVIDIA)也拉了进来。即便如此,苹果WWDC 2026主题演讲中,提出的问题和解答的问题一样多。庆幸的是,这家总部位于库比蒂诺的科技巨头正以闪电般的速度发布澄清,几乎是战时状态般加紧解决悬而未决的疑虑。

Apple-Intelligence-1-1-scaled.jpeg

苹果巧妙地模糊了谷歌对其新Apple Intelligence架构的贡献,不遗余力地指出自己的技术才是这一新范式的核心。我们已经知道,Apple Intelligence由设备端模型和云端模型组合而成。即便如此,这种区分之前也并不十分清晰。苹果刚刚澄清:AFM Cloud苹果自家的模型,使用Gemini(Gemini)的输出进行训练;AFM本地模型完全是苹果自己的模型;AFM Cloud Pro似乎基于Gemini的基础模型和数据,但苹果自己进行了预训练、后训练、强化学习等。

值得庆幸的是,苹果刚刚发布了一项关键更新,指出那个支撑复杂查询的大型云端苹果基础模型(Apple Foundation Model,简称AFM),即AFM 3 Pro,是其自家产物,尽管它是从同等规模的谷歌Gemini模型中蒸馏而来。当然,我们已知几个前苹果谷歌授权了一个1.2万亿参数的Gemini模型。看来,这家iPhone制造商只是将谷歌的技术用于模型蒸馏目的。苹果还特别指出,它在AFM Cloud上自行进行了预训练和后训练操作。

苹果还详细介绍了其私有云计算(Private Cloud Compute,简称PCC)框架的架构,并指出:

谷歌云(Google Cloud)PCC的新颖之处在于其实现方式:使用英伟达GPU的英伟达机密计算(NVIDIA Confidential Computing)、搭载TDX技术的英特尔(Intel)CPU,以及谷歌Titan芯片。”

苹果表示,虽然AFM Cloud托管在谷歌云中,但这一安排拥有业界最全面的透明度保障,允许外部安全研究人员验证我们的隐私承诺。为了降低供应链攻击的风险,我们维护了一个加密可验证、仅可追加的账本,记录了所有属于PCC机群的谷歌云硬件。谷歌云上的PCC利用了许多与苹果芯片上PCC相同的架构安全模式来实现这些分层保护:每个请求的初始网络数据解析在各自命名空间内的专用进程中进行;共享推理软件具有较短的生存时间(TTL),会被回收;已认证密钥保存在一个独立的、专用的、与外部输入隔离的机密虚拟机中。

苹果还表示,它将提供公共研究工具,并通过苹果安全赏金计划(Apple Security Bounty Program),以研究模式提供对实时PCC节点的访问权限。苹果进一步澄清,AFM Cloud本身分为三类:运行在谷歌云英伟达GPU上的AFM 3 Cloud Pro,一个被称为AFM 3 Cloud的基础版本模型,以及一个用于图像生成的ADM 3 Cloud (Image),后两者都运行在苹果自家的服务器上。

就设备端苹果基础模型而言,AFM 3 Core Advanced拥有200亿个参数,但仅加载处理特定推理请求所严格需要的参数数量,一次仅激活10亿到40亿个参数。关键的是,这个模型完全由苹果设计,并且需要A19 Pro芯片才能在iPhone上运行。苹果对此解释如下:并非将整个模型强制加载到DRAM,完整模型存储在闪存(NAND)中。由于NANDDRAM的带宽太慢,无法像标准MoE模型要求的那样逐个词元地交换权重,AFM 3 Core Advanced会为每个提示做出路由决策。

苹果接着补充道:AFM 3 Core Advanced并非为所有任务使用单一模型,也并非管理一组较小的模型,而是使用针对每个特定用例预设数量的活跃参数。当然,苹果也为较旧iPhone上的通用推理准备了性能稍弱的设备端模型,称为AFM 3 Core,仅有30亿个参数。基本上,苹果的所有模型都在TPU上训练,除了AFM 3 Cloud Pro之外,其他所有模型都运行在苹果芯片上。当用户提交请求时,例如通过Siri(Siri AI),一个本地化编排器会调用所需工具,收集数据,然后为AFM Cloud生成提示。关键的是,原始数据不会被发送到云端,只有结构化的提示信息。

当然,在此之前,苹果在技术展示的大部分时间里都在淡化谷歌在新的Apple Intelligence私有云计算框架中的作用,指出它既没有使用谷歌为其客户部署的模型,也没有使用其基础设施。


文章标签: #苹果 #AI #大模型 #云计算 #英伟达

负责编辑

  菠萝老师先生 

  让你的每一个瞬间都充满意义地生活,因为在生命的尽头,衡量的不是你活了多少年,而是你如何度过这些年。