编辑 | 萝卜皮
分子模拟为了解均匀冰核形成的微观机制提供了有价值的见解。虽然经验模型已被广泛用于研究这一现象,但迄今为止,基于第一性原理计算的模拟已被证明过于昂贵。即使是近期,由于量子力学计算的计算成本过高,大部分人认为以量子精度模拟冰核形成是不可能的。
机器学习的最新进展使这些计算变得易于处理,从而大大扩展了基于从头计算量子力学理论的分子动力学的应用领域。
普林斯顿大学(Princeton University)的研究人员应用人工智能来预测过冷水中冰核的形成速率,并在不依赖经验力场的情况下研究与成核相关的其他量,尽管引用了经典成核理论的组织框架。这项工作是朝着,在更现实的环境和化学反应发挥重要作用的条件下,模拟成核过程,迈出的重要一步。
该研究以「Homogeneous ice nucleation in an ab initio machine-learning model of water」为题,于 2022 年 8 月 8 日发布在《PNAS》。
过冷液态水中的冰结晶是自然界中最具代表性的相变之一。它在调节地球气候和许多应用中至关重要,例如人工云播种、冷冻保存和食品加工。分子模拟已被证明是一种宝贵的工具,可以深入了解这一过程的分子水平细节,并在实验不易接近的条件下进行预测。
例如,犹他大学(The University of Utah)的 Lupi 团队考虑了堆积无序(即存在六边形和立方冰的交替层)对成核率的影响,犹他大学的 Sanz 团队则使用了超过 100,000 个分子的系统来计算低过冷度下的成核率。
然而,迄今为止进行的冰成核模拟采用了相对简单的经验模型,例如水 mW 的粗粒单原子模型或四点刚性 TIP4P 水模型。研究这种现象的另一种途径是使用从头算分子动力学(MD)。
在这种技术中,作用在原子核上的力来自电子结构计算。与经验模型不同的是,从头算势能面不依赖经验信息,捕捉原子之间复杂的键合行为,并描述化学键的形成和断裂。多体电子薛定谔方程的解通常难以处理,在这种情况下广泛使用的近似是 Kohn-Sham 密度泛函理论 (DFT)。然而,由于计算成本高,从头算 MD 的应用几十年来一直局限于模拟相对较小的系统(~1,000 个原子)和短时间(~100 ps)。这种限制排除了从第一原理研究冰核的可能性。
这个难题的一个解决方案是使用机器学习算法,该算法能够学习从 DFT 数据中获得的能量和力。以这种方式构建的机器学习原子间模型以高保真度再现了从头算势能面,比 DFT 快了几个数量级,并且还显示出随原子核数量的线性缩放。这种模型最近已应用于研究硅和镓中的晶体成核。然而,先前使用第一性原理模型的模拟只探索了相对较大的过冷,几千个原子的系统能够包含所需的晶体簇。
在这里,普林斯顿大学的研究人员使用水的从头算机器学习模型计算冰核率。研究人员采用种子技术和多达 300,000 个原子的系统,以便在广泛的过冷范围内获得成核率。其结果使研究人员能够将来自第一原理的模型的预测与成核率的直接实验测量进行比较。虽然该团队只明确地模拟了六边形冰簇,但他们使用具有堆积无序的冰的化学势模型考虑了堆积无序的影响。
图示:堆积无序对速率的影响。(来源:论文)
在均质冰核化过程中,大量液态水中形成冰簇。通常,这种现象发生在低于融化温度的温度下,因此存在形成冰的驱动力。然而,液体中冰团的形成会产生液固界面,并伴随着能量损失。有利的体积项和不利的表面项之间的竞争,导致了系统必须克服的自由能屏障才能继续进行转变。
自由能垒的存在使成核成为一种罕见的事件,并严重阻碍了使用分子模拟直接研究该现象的能力。尽管已经尝试通过使用直接的分子模拟来研究冰成核,但总的来说,必须使用更复杂的技术来解决这个问题。
在计算机上研究冰核的一种可能途径是稀有事件技术,例如路径采样、正向通量采样或元动力学。这些方法可以为成核机制提供有价值的见解,尽管计算成本很高。一个更简单的替代方案是播种技术,它基于在不同温度下执行一系列相对较短的模拟,从包含嵌入液态水中的冰团的配置开始。
这些模拟的目的是找到温度 T^∗,对于该温度,选择的集群是关键的——也就是说,在 T^∗,集群具有相同的生长和解冻概率。然后将该信息与经典成核理论(CNT)的方程结合使用,以计算成核速率。这种方法有几个可能影响计算速率的潜在缺陷,例如选择适当的顺序参数来计算簇大小,以及 CNT 对所研究的成核过程的适用性。以前的众多研究已经仔细考虑了这些限制,并且已经证明播种技术可以提供与其他方法非常一致的成核率。
模拟冰核形成的另一个关键因素是准确描述原子间相互作用。在这里,研究人员从第一性原理计算得出原子核之间的力。特别是,他们使用采用强约束和适当规范(SCAN)交换和相关功能的 DFT。SCAN 可以说是可用的最好的半局部泛函之一,并且已经使用该泛函研究了冰和水的许多性质 ——例如,在之前的研究中,直接使用 DFT 力驱动动力学成本过高;于是,该团队使用了基于 DFT 数据训练的机器学习模型。该模型基于深度神经网络,使用中国科学院院士鄂维南团队开发的深度潜力方法构建。
普林斯顿大学的研究人员将此模型称为 SCAN-ML(即 SCAN 训练的、基于机器学习的模型)。SCAN-ML 模型经过仔细训练,可以在水相图的广大区域内重现数据。SCAN-ML 已被用于提供在深度过冷条件下存在液-液转变的证据,并用于研究冰 Ih–ice XI 转变。该模型与冰成核相关的热力学性质在之前的研究中得到了彻底的表征。该模型的熔化温度为 312 K,比实验值大 40 K 左右。模型中熔化时的密度变化为 6%,略小于实验中发现的 9%。
图示:播种模拟中使用的 Ice Ih 集群。(来源:论文)
另一个重要特性是冰 Ih 和冰 Ic 之间的相对稳定性,它们是在环境压力下冰成核过程中的两个竞争多晶型物。SCAN-ML 模型正确预测冰 Ih 比冰 Ic 更稳定,与实验一致。之前,研究人员还分析了 SCAN-ML 模型在包含与液态水和冰兼容的原子环境的配置中再现 SCAN 能量的能力,发现该模型是 SCAN 的忠实表示,每个 H2O 分子的偏差小于 1.3 meV。
下图提供了 SCAN-ML 模型的属性摘要,研究人员使用经验水模型 TIP4P/Ice 和 mW 将它们与实验数据和结果进行了比较。
SCAN-ML 相对于经验模型的优势
SCAN-ML 是一个全原子、完全灵活的模型,与经验势不同,例如 mW,它是一个粗粒度模型,以及 TIP4P/Ice,它是一个全原子刚性模型。由于 SCAN-ML 再现了 DFT 势能面,OH 键的灵活性取决于环境,而在灵活的经验模型中,如 TIP4P/2005f,通过使用简单的函数形式和一些不依赖于环境的参数来建模键的灵活性。
另一个取决于环境的特性是水分子的偶极矩。例如,液态水和冰的偶极矩不同,但也会随着环境而表现出更微妙的变化。SCAN-ML 是可极化的,能够捕捉与偶极矩变化相关的效应。SCAN-ML 也是完全反应性的,可以描述水中的质子转移过程。
该模型捕获了超越二体和三体的多体相互作用,而 mW 仅限于三体相互作用,而 TIP4P/Ice 仅基于二体相互作用。SCAN-ML 和 TIP4P/Ice 都可以描述冰 Ih 的一个重要特征,即质子无序,由于缺乏质子,在粗粒度 mW 中不存在质子无序。
图示:液态水-冰 Ih 界面自由能。(来源:论文)
SCAN-ML 还有哪些不足
该团队基于 SCAN-ML 的模拟也有一些限制。虽然电子自由度是用量子力学来处理的,但原子核的动力学是基于经典力学的运动方程。因此,研究人员忽略了可以使用路径积分 MD 建模的核量子效应(NQE)。
另一个缺点是 SCAN-ML 的计算成本比经验模型高大约 1 到 2 个数量级。此外,SCAN-ML 的性质与实验性质有所不同,这表明 SCAN 功能在描述水和冰方面的局限性。
最后,该模型是短程的,交互截止值为 6Å。因此,它无法捕捉到长程静电相互作用(例如,存在于 TIP4P 模型中)或超出此范围的范德华力。可以使用最近引入的深度势能长程方案来模拟远程静电相互作用。
结语
总之,在这项工作中,研究人员应用人工智能来预测过冷水中冰核的形成速率,这为在更现实的环境和化学反应发挥重要作用的条件下,模拟成核过程,迈出的重要一步。
「我们研究中使用的深度势能(Deep Potential)方法将有助于实现从头算分子动力学的前景,从而对复杂现象产生有价值的预测,例如化学反应和新材料的设计。」这项研究的参与者,Susan Dod Brown 化学教授 Athanassios Panagiotopoulos 说。
「我们正在研究来自自然基本定律的非常复杂的现象,这对我来说非常令人兴奋。」该研究的第一作者、普林斯顿大学化学博士后研究员 Piaggi 说。
论文链接:https://www.pnas.org/doi/abs/10.1073/pnas.2207294119
相关报道:https://phys.org/news/2022-08-simulation-artificial-intelligence-ice.html