2022/05/09 15:04

训练数据减少多达三个数量级，等变图神经网络在长时间尺度上进行高保真分子动力学模拟

编辑/绿萝

分子动力学（MD）模拟是在能源存储、催化和生物过程等领域进行计算发现不可或缺的工具。在实践中，第一性原理方法的不利计算尺度将模拟限制在较短的时间尺度和较少的原子数。基于机器学习，特别是神经网络的原子间势能灵活模型的构建，有望从从头算参考计算中学习高保真势能，同时保留有利的计算效率。

近日，来自哈佛大学的研究团队提出了神经等变原子间势 (NequIP)，这是一种 E(3) 等变图神经网络方法，用于从分子动力学模拟的从头算计算中学习原子间势。NequIP 优于现有模型，训练数据减少多达三个数量级。该方法能够在长时间尺度上进行高保真分子动力学模拟。

该研究以「E(3)-equivariant graph neural networks for data-efficient and accurate interatomic potentials」为题，于 5 月 4 日发布在《Nature Communications》上。

机器学习在原子间势研究中的第一个应用是建立在基于描述符的方法上，结合了浅层神经网络或高斯过程，旨在展示平移、相同化学物质的原子排列和旋转方面的不变性。

最近，旋转不变图神经网络原子间势（GNN-IPs）已成为一种强大的原子间势深度学习体系结构，它消除了手工制作描述符的需求，允许从几何数据的不变特征中学习原子图上的表示。

相比之下，NequIP 使用相对位置向量而不是简单的距离（标量），不仅包含标量，还包含高阶几何张量的特征。这使得内部特征改为与旋转等变，并允许旋转等变滤波器使用角度信息。与其他方法类似，可以将卷积限制为所有其他原子的局部子集，这些原子比选定的截止距离 rc 更靠近中心原子。

图 1：NequiIP 网络架构。

本工作的贡献在于，在几何张量上构建了基于 E(3) 等变卷积的分子和材料的深度学习节能原子间势，从而产生了最先进的准确性和出色的数据效率，并且可以从分子动力学模拟中以高保真度再现结构和动力学特性。

NequIP 网络架构

NequIP 网络架构如图 1 所示，建立在原子嵌入的基础上，然后是一系列交互块，最后是输出块：

嵌入：在 SchNet 之后，使用可训练的嵌入生成初始特征，该嵌入仅对原子序数 Zi（通过 one-hot 编码表示）进行操作，通过可训练的自交互层实现。
交互块：交互块编码相邻原子之间的交互：该块的核心是卷积函数。产生相同旋转和奇偶校验对 (lo, po) 的不同张量积交互的特征由线性原子级自交互层混合。为交互块配备了 ResNet 样式的更新。最后，混合特征由等变的基于 SiLU 的门非线性处理。
输出块：最终卷积的 l= 0 特征被传递到输出块，该输出块由一组两个原子级自交互层组成。

对于每个原子，最后一层输出一个标量，它被解释为原子势能。然后将这些相加得出系统的总预测势能。随后获得力作为预测的总势能的负梯度，从而确保能量守恒和旋转等变力。

方法验证

研究人员在一系列具有挑战性的数据集上验证了所提出的方法：首先，证明该方法提高了 MD-17（一个广泛用于基准测试 ML- 的有机小分子数据集 IP）的最新精度。接下来，展示了 NequIP 可以准确地学习在量子化学 CCSD(T) 理论水平上在小分子上获得的力。为了扩大该方法在小的孤立分子之外的适用性，最后，探索了一系列具有周期性边界条件的扩展系统，包括表面和块状材料：不同相的水，固/气界面处的化学反应，无定形磷酸锂和锂超离子导体。

研究人员首先在 MD-17 上评估了 NequIP。

表 1：原始 MD-17 数据集上分子的能量和力 MAE。

表 2：修订后的 MD-17 数据集上分子的能量和力 MAE。

研究发现 NequIP 优于所有其他方法。与 sGDML 和 FCHL19/GPR 相比，准确度的持续改进尤其令人惊讶，因为它们基于核方法，通常在小型训练集上获得比深度神经网络更好的性能。对旋转顺序 l ∈ {0, 1, 2, 3} 运行收敛扫描，发现将张量秩增加到超过 l = 1 会得到一致的改进。从 l = 0 到 l = 1 的显著改进突出了等方差在提高该任务的准确性方面的关键作用。

接下来，利用 NequIP 的高数据效率，在一组以量子化学精度计算的分子（CCSD 的阿司匹林，CCSD(T) 的所有其他分子）进行评估，并将结果与 sGDML 和 GemNet 报告的结果进行比较。

补充表 1：CCSD/CCSD(T) 精度下分子的能量和力 MAE。

结果表明，NequIP 可以准确地学习在量子化学 CCSD(T) 理论水平上在小分子上获得的力。

最后，为了证明 NequIP 在小分子之外的适用性，探索了一系列具有周期性边界条件的扩展系统，包括表面和块状材料：不同相的水，固/气界面处的化学反应，无定形磷酸锂和锂超离子导体。

作为第一个示例，使用由液态水和三个冰系统组成的联合数据集在 PBE0-TS 理论水平上计算。

表 3：液态水和三个冰系统上的能量和力的 RMSE。

研究发现，在训练数据减少 1000 倍的情况下，NequIP 在力分量误差的数据集的所有四个部分上都显著优于 DeepMD。

将 NequiIP 应用于催化表面反应。特别是，研究了甲酸盐在 Cu < 110 > 表面上进行脱氢分解 (HCOO* → H* + CO2) 的动力学。

图 2：基准系统。

在 2,500 个结构上训练的 NequIP 模型在 C、O、H 和 Cu 四种元素上分别获得了 19.9 meV/Å、71.3 meV/Å、13.0 meV/Å 和 47.6 meV/Å 的力分量的 MAE。从中发现平均力 MAE 为 38.4 meV/Å，在这四个每个物种 MAE 上的权重相等，以及能量 MAE 为 0.50 meV/原子，表明 NequIP 能够准确地模拟该复合物的原子间力反应系统。

为了检验 NequIP 模型捕捉动力学特性的能力，研究人员证明 NequIP 可以描述具有 Li4P2O7 成分的无定形磷酸锂的结构动力学。

表 4：用于 LiPS 和 Li4P2O7 的 NequiIP E/F MAE/RMSE。

为了证明 NequIP 可以从小型训练集以高精度模拟动力学传输特性，研究人员研究了 LiPS (Li6.75P3S11) 中的锂离子扩散率。测量了这些 NequIP 驱动的 MD 模拟中的 Li 扩散率，这些模拟从不同的初始速度开始，从 Maxwell-Boltzmann 分布中随机采样。

图 3：锂动力学。

发现平均扩散率为 1.25 × 10−5cm^2/s，与 AIMD 计算的 1.37 × 10−5cm^2/s 的扩散率非常一致，从而实现了低至 9% 的相对误差。

研究人员表示：未来工作的一个有希望的方向是研究明确包含远程交互的潜在好处，并测量消息传递机制在多大程度上（如果有的话）这些可能被捕获。我们期望所提出的方法将使计算化学、物理学、生物学和材料科学领域的研究人员能够以更高的准确性和效率对复杂反应和相变进行分子动力学模拟。

论文链接：https://www.nature.com/articles/s41467-022-29939-5

理论