新物质的发现对于解决人类面临的诸多重大挑战至关重要。不过,正如微软所指出的,传统的新物质发现方法难度极大,就好比在大海里捞针。

MatterGen

在过去,人们发现新物质主要依靠费时费力且成本高昂的试错实验。近年来,通过对海量材料数据库进行计算筛选,这一进程得以加快,但依然需要耗费大量时间。

如今,微软推出了一款强大的生成式 AI 工具,有望大幅加速这一进程。这款名为 MatterGen 的工具,不再沿用传统的筛选方法,而是根据设计要求直接制造出新型材料,为材料发现带来了一种可能具有颠覆性的新途径。

微软在《自然》杂志上发表的论文中介绍,MatterGen 是一种在材料三维几何结构内运行的扩散模型。就像图像扩散模型会通过调整像素颜色来根据文本提示生成图像一样,MatterGen 则是通过改变随机结构中的元素、位置以及周期晶格来生成材料结构。这种专门定制的架构,就是为了应对材料科学中周期性和三维排列等独特需求而设计的。

微软表示,“MatterGen 开启了一种新的生成式 AI 辅助材料设计范式,能够高效地探索材料,突破已知材料的有限范围”。

传统的计算方法是筛选庞大的潜在材料数据库,以找出具有所需属性的候选材料。但这些方法在探索未知材料方面能力有限,研究人员往往需要在找到有希望的候选材料之前,先筛选数百万个选项。

与之不同的是,MatterGen 从零开始,根据化学、机械属性、电子属性、磁性行为或这些约束的组合等特定提示来生成材料。该模型是基于材料项目和亚历山大数据库编制的 60.8 万种稳定材料进行训练的。

在一项对比中,MatterGen 在生成具有特定属性的新型材料方面,显著优于传统筛选方法,尤其是生成体模量大于 400GPa 的材料,即那些难以被压缩的材料。传统筛选方法随着时间推移,其已知候选材料池逐渐耗尽,回报也逐渐减少,而 MatterGen 却能持续生成越来越新颖的结果。

在材料合成过程中,经常会遇到组成无序这一难题,即原子在晶体晶格内会随机交换位置。传统算法在判定什么才算“真正新颖”的材料时,往往难以区分相似结构。

为了解决这一问题,微软开发了一种新的结构匹配算法,将组成无序纳入评估之中。该工具能够识别两个结构是否仅仅是同一底层无序结构的有序近似,从而更有力地定义新颖性。

为了证明 MatterGen 的潜力,微软与中国科学院深圳先进技术研究院的研究人员展开合作,实验合成了由 AI 设计的一种新型材料。

这种名为 TaCr₂O₆ 的材料,是 MatterGen 生成的,目的是达到 200GPa 的体模量目标。尽管实验结果略低于目标,测量的模量为 169GPa,但相对误差仅为 20%,从实验角度来看,这已经是很小的偏差了。

有趣的是,最终材料出现了 Ta 和 Cr 原子之间的组成无序,但其结构与模型预测非常接近。如果这种预测精度能够应用到其他领域,MatterGen 可能会对电池、燃料电池、磁体等的材料设计产生重大影响。

微软将 MatterGen 定位为其之前 AI 模型 MatterSim 的补充工具,后者能够加速材料属性的模拟。两者结合,可以形成一个技术“飞轮”,在迭代循环中,既能增强对新材料的探索,又能提升对其属性的模拟。

这种做法与微软所说的“科学发现的第五范式”相契合,在这一范式下,AI 不再局限于模式识别,而是能够积极地指导实验和模拟。

微软已经在 MIT 许可下发布了 MatterGen 的源代码。除了代码,团队还提供了模型的训练和微调数据集,以支持进一步的研究,并鼓励更广泛地采用这项技术。

回顾生成式 AI 更广泛的科学潜力,微软将其与药物发现领域相类比,在药物发现领域,此类工具已经开始改变研究人员设计和开发药物的方式。同样,MatterGen 也可能彻底改变我们对材料设计的处理方式,尤其是在可再生能源、电子和航空航天工程等关键领域。


文章标签: #微软 #材料发现 #生成式AI #MatterGen #人工智能

负责编辑

  菠萝老师先生 

  让你的每一个瞬间都充满意义地生活,因为在生命的尽头,衡量的不是你活了多少年,而是你如何度过这些年。