晶体缺陷是指晶体结构中周期性的排列规律被打破的情况。理想的晶体,具有周期性的晶体结构。然而,在大多数的实际晶体中,原子或分子的排列并非如此完美,这样就造成了晶体缺陷。
一个晶格空位是晶体的点缺陷之一。空位缺陷形成焓(vacancy defect formation enthalpy)是指在晶体中形成一个空位所需要的能量。这个值越大,说明形成空位的难度越大,材料的稳定性越高。
已有基于人工设计特征的线性或机器学习(ML)模型来建模空位形成焓。然而,仍然需要一种通用的解决方案。
在此,来自美国桑迪亚国家实验室、国家可再生能源实验室和劳伦斯利弗莫尔国家实验室联合印度理工学院海德拉巴分校(Indian Institute of Technology Hyderabad)的研究团队,提出了一种图神经网络方法,可以完全自动地预测理想晶体结构中任何晶体位点的缺陷形成焓,而无需创建缺陷原子结构模型作为输入。
该研究以「Defect graph neural networks for materials discovery in high-temperature clean-energy applications」为题,发布在《Nature Computational Science》上。
密度泛函理论 (DFT) 是高通量计算空位形成焓的首选方法。然而,到目前为止,明确的 DFT 缺陷计算仅适用于现有计算数据库中包含的一小部分化合物。因此,成功的替代建模方法可以避免 DFT 的成本要求,对于有效促进这些应用中的材料发现工作至关重要。
此前,有研究基于人工设计特征的线性或机器学习(ML)模型来建模空位形成焓。然而,仍然需要一种通用的解决方案,即自动预测任何材料类别中任何晶体位点的空位形成焓,以及无需对材料描述符进行手动特征工程。
深度学习技术,例如图或卷积神经网络,可以规避这些限制。该模型不需要手工制作输入特征向量来描述训练示例,而是直接从从晶体结构的图表示导出的输入特征的迭代卷积和非线性变换中学习特征表示。图神经网络 (GNN) 已成功用于晶体结构属性预测。
在此,研究人员扩展了 GNN 概念来直接预测空位缺陷形成焓。唯一需要的输入是无缺陷的 DFT 弛豫主体(host)结构,模型输出是结构中任何位点的预测弛豫空位形成焓。因此,替代模型取代了对主体中每个对称非等效原子位点进行昂贵的 DFT 超晶胞弛豫的需要,在成分和结构复杂的超晶胞模型中,这些原子位点的数量可能相当大(在该研究中最多约 100 个)。
其他 DFT 计算的主体属性可以很容易地编码到材料的图表中,以进一步提高预测准确性。现有的计算数据库包含数以万计的化合物,可能有数百万个非等效缺陷位点,可以使用桌面计算资源以自动方式进行筛选,预测精度主要受到空位缺陷训练数据的数量和多样性的限制。
开发多样化的空位缺陷数据库
研究人员开发了一个用于 DFT 空位缺陷计算的自动化工作流程:
(1)从 NRELMatDB 中可用的无机晶体结构数据库导入化学计量主体氧化物晶体结构;
(2)在铁磁和不同可能的反铁磁自旋构型中弛豫主体超晶胞;
(3)选择能量最小的主体原子和磁结构;
(4)使用自动缺陷框架对超细胞进行点缺陷计算。在数据采集步骤中,提取主体属性并计算空位形成能,然后分别提供输入和目标属性,用于训练 ML 模型。
通过以下方式计算缺陷形成的焓:
最终的 DFT 训练数据库包含来自约 200 种 parent 氧化物的约 1,500 个独特缺陷位点,涵盖 15 种阳离子(Mg、Al、Ca、Ti、Mn、Fe、Co、Ni、Sr、Y、Nb、In、Ba、La 、Ce)、58 个独特的空间群和 51 个独特的化学计量。之前的 STCH 材料搜索主要针对钙钛矿化学计量和相关结构系统(立方晶系、斜方晶系、四方晶系)。而该训练数据高度多样化,分布在所有七种晶体结构系统中,并包括广泛的化学计量,以涵盖不同的配位环境和金属离子氧化态从 2+ 到 5+。
空位缺陷的 GNN 模型
研究人员创建了一个空位 dGNN 代理模型 fdGNN 来替换方程 (1),由权重 θ 参数化,其一般形式为:
在预测时,方程 (2) 否定了每个独特对称位点的 DFT 超胞弛豫成本,大大降低了高通量材料筛选的计算成本。
dGNN 方法的另一个关键特征是,它通常独立于使用哪种底层图编码、卷积架构,这对于快速扩展的材料建模 GNN 领域非常重要。在训练数据有限的情况下运行,研究人员采用了一种卷积架构,它与原始的晶体图卷积神经网络(CGCNN)方法密切相关,因为与最近改进但更复杂的变体相比,它相对简单。
与之前建模工作的比较
与之前的建模工作相比较,dGNN 方法的优点总结如下:
(1)预测弛豫缺陷形成能量时,至少只需要主体晶体结构作为输入。
(2)通过图卷积自动导出缺陷特征向量,不依赖于手工设计的特征。
(3)继上一点之后,学习到的缺陷向量不包含特定于或仅为某些晶体结构或元素定义的特征。
(4)该方法不依赖于底层卷积架构的形式,因此可以根据不断扩展的训练数据集的大小采用更复杂的卷积方法。
(5)随着训练数据的增加,准确率可以不断提高。
由于以前的缺陷建模方法无法同时实现上述所有功能,dGNN 显著提高了通用性。
特别是与之前为氧化缺陷设计的模型相比,在当前训练数据集上的 CV 性能可与通过仔细的特征工程导出来预测中性氧空位形成焓的线性模型的性能相媲美。相对于其他 ML 在氧化物空间之外的缺陷预测工作,新方法具有相当的准确性,大大提高了泛化性。
从应用的角度来看,研究人员展示了预测金属氧化物缺陷特性并进行高通量筛选以确定高温、清洁能源应用的最佳候选材料的方法。通过考虑高通量中的构型熵,可以评估有限温度下的材料性能,而不是纯粹依赖于单个缺陷预测的零开尔文图片。
最后,随着获得更多训练数据,这项工作将成为未来广泛应用于缺陷关键应用的材料发现工作的直接起点。通过对材料图编码和池化进行小幅调整,该方法将快速应用于高度复杂的缺陷建模任务。
论文链接:https://www.nature.com/articles/s43588-023-00495-2
参考内容:https://zh.wikipedia.org