通常,科学研究的模拟任务会在超级计算机上运行,因为这些任务需要巨大的计算吞吐量。有些研究——例如模拟具有指数级相互作用态的分子量子行为——甚至需要量子计算机才能完成,或者必须通过简化处理才能在现代超级计算机上实现。然而,据VastData报道,中国神威的科学家们成功运用人工智能模型和现有的Oceanlite超级计算机,在真实分子尺度上完成了复杂量子化学模拟,这堪称科学与技术的双重突破。

量子力学中的量子态——由波函数(Ψ)描述——决定了量子系统的所有可能构型,例如分子中电子等粒子的位置、自旋或能级及其概率分布。对其进行建模极具挑战性,因为状态空间会随粒子数量呈指数级增长,使得在我们当前使用的经典超级计算机上进行模拟变得不可能(且不可行)。为此,科学家们采用多种近似方法来简化量子方程,同时保持描述分子结构、反应和能量的精确度。然而现有波函数近似方法的扩展能力仅限于小分子体系。
为研究具有强电子关联的多体量子系统(例如包含数十个电子、超过100个自旋轨道等),数年前物理学家提出采用现代机器学习替代方法,如神经网络量子态(NNQS)来近似描述分子内所有可能的电子构型与运动。这种方法有望将人工智能的扩展性与量子精度相结合,用于传统方法目前无法实现的研究。
为开展包含120个自旋轨道的实验,研究人员自主开发了NNQS框架。其模拟过程通过训练神经网络来近似分子波函数,从而确定电子最可能出现的位置。针对每个采样的电子排布,系统会计算局部能量并调整网络参数,直至其预测结果与分子的真实量子能量模式相匹配。
专为中国Oceanlite超级计算机定制的NNQS系统,基于支持FP16、FP32和FP64数据格式的384核神威SW26010-Pro处理器,其独特架构专为高性能计算而非人工智能优化。研究人员特别考量了SW26010-Pro的工作负载并行化与数据处理机制。
研究团队设计了分层通信模型:管理核心负责处理器与节点间的协调,而数百万个配备512位矢量引擎的“轻量级”双发射计算处理单元(CPE)则执行局部量子计算。此外,他们还创建了动态负载均衡算法,确保不均匀的计算负载不会导致任何核心闲置。
科学家们在3700万个CPE核心上运行代码,实现了92%的强扩展效率和98%的弱扩展效率,在此规模下展现出极高效率。这表明开发者实现了软硬件近乎完美的协同,这是中国超算界的重大成就。同时,迄今对120个自旋轨道分子系统的模拟,是在经典超级计算机上进行的规模最大的AI驱动量子化学计算,标志着中国人工智能与量子产业的重大突破。
毫无疑问,该成果证明了NNQS可在现代超级计算机上用于量子物理研究。然而,使用如Oceanlite这样的百亿亿次级超级计算机进行基于AI的量子物理研究,其在投入精力与能耗方面的效率仍有待商榷。



