苹果芯片组(如M4)中的神经网络引擎(Neural Engine)仅可用于推理,这意味着开发者能运行预训练的AI模型,但无法训练新模型。幸运的是,有一个人似乎通过绕过其软件限制、将所有数据保留在RAM(随机存取存储器)中、让一切运行得极其流畅且速度飞快的逆向工程手段,成功破解了这款SoC(系统级芯片)

Apple-M4.jpeg

更令人惊叹的是,实现这一壮举时完全无需借助CoreMLMetal等工具,就解锁了M4的真正潜力。在X平台(原Twitter)上,用户@0x0SojalSec在一个GitHub代码仓库中分享了如何解锁M4真正实力的方法。由于苹果(Apple)并未提供任何与这些芯片组通信的权限级别,此人成功绕过了苹果的所有工具(如CoreMLMetal或利用GPU(图形处理器)),直接与M4通信。这一成就依靠的是从头开始开发的定制MIL(模型中间语言)

由于硬件被“锁定”,必须采用一些巧妙的技术。例如,当训练过程陷入停滞并需要重置才能继续时,定制MIL会使用命令“exec()”来“重生以继续训练”。这有助于程序刷新当前状态,从而在不崩溃的情况下持续学习。

苹果在每一台M4 MaciPhone中隐藏了15.8 TFLOPS的原始AI算力,但他们只允许你使用神经网络引擎进行推理。我们对其私有API进行了逆向工程,直接在ANE(神经网络引擎)上实现了完整的反向传播和Transformer训练。没有CoreML,没有Metal,没有GPU。训练……(2026年6月15日推文)

为加速这一进程,@0x0SojalSec表示,解锁M4时完全未涉及写入速度较慢的NAND闪存。由于所有数据都写入RAM,速度极快。通过突破软件限制,iPadMac中的M4可实现高达15.8 TFLOPS的AI处理性能,足以训练一个AI模型,而无需购买昂贵的计算机或价格离谱的英伟达GPU(NVIDIA GPU)

考虑到这一成就是在M4上实现的,想象一下在M5上能解锁的性能水平。遗憾的是,我们无法确认同样的定制MIL能否用于更新的Apple Silicon,也无法确定exec()能否在新平台上如预期般运行。希望我们能再次看到这段代码的实际应用。


文章标签: #黑客破解 #M芯片 #AI算力 #逆向工程 #神经网络引擎

负责编辑

  菠萝老师先生 

  让你的每一个瞬间都充满意义地生活,因为在生命的尽头,衡量的不是你活了多少年,而是你如何度过这些年。