在过去的20年里,第一性原理模拟成为许多科学和工程领域中强大且广泛使用的工具。电子结构方法应用广泛,从纳米技术到行星科学,从冶金到量子材料。鉴于目前模拟是在数字计算机上运行的,近几十年来,其吞吐量每隔12到18个月翻一番,机器学习和人工智能正在加速搜索和预测材料特性。「模拟不会以惊人的方式失败,但可以微妙地从无价到勉强到无用。但模拟是不可替代的。」模拟与计算科学的所有分支共享研究的一个关键要素:模拟可以复制、开放和共享,这是任何物理基础设施永远无法实现的。最近,发表在《自然·材料》(nature materials)的一篇综述「材料设计的电子结构方法 」(Electronic-structure methods for materials design)概述了模拟背后的电子结构方法及其在材料性能预测中的应用,以及用于材料设计和发现更广泛目标的不同策略。
作者首先研究了密度泛函理论 (DFT) 的框架,并概述了可以提高准确性或扩展模拟范围的日益复杂的方法。然后,讨论了计算材料科学开发的功能,利用工具箱在复杂性不断增加的现实条件下预测材料的特性。最后,强调了物理或数据驱动的方法如何为材料发现提供合理、高通量或人工智能的途径,并解释这些努力如何改变整个研究生态系统。目前,DFT是有效且准确计算凝聚系统基态属性的首选方法。是一种广泛使用的成熟技术。尽管如此,对于材料模拟,代码最近才开始系统地相互验证以确保数值精度。对实验的验证具有更长的历史,在高通量方法的帮助下,出现了许多研究,它们提供了关于弹性和电子特性预测的综合参考数据。但预测准确性仍然是主要挑战之一,而进步通常需要完善的特定领域知识来利用这些计算。DFT在解决材料复杂性方面的一个关键优势是:将焦点从寻找基态波函数转移到寻找基态波函数电荷密度。缺点是DFT的通用功能是未知的,但已被证明存在。 电子结构方法。这里捕获了电子结构方法的复杂情况,对方法的层次进行了分组,这些方法逐步扩展了范围和准确性,同时增加了成本和复杂性。(来源:论文)要执行实际计算,需要解决KS方程(基态能量可以通过直接最小化总能量泛函数Evext[ρ]得到,或者等价地通过与变分原理相关的Euler Lagrange方程得到。这些被称为Kohn-Sham方程)的数值解和近似xc泛函。
数值解涉及算法选择。用全电子或伪电势处理电子-离子相互作用,可以用各种各样的基集表示轨道和数值方法。这种多样性转化为当今可用的许多广泛使用的电子结构代码(Table 1)。对于材料模拟,自然体现周期性的平面波方法和增强波方法是最常见的一些方法。
从DFT基态计算中获得的选定材料特性的概述。(来源:论文)
寻求xc函数近似值是更基本的问题。在最初的KS公式中已经进行了局部密度近似(LDA)。尽管当时并不为人所知,但LDA 满足xc孔的精确求和规则;正是这种精确的约束,以及建立非相互作用的KS系统以近似动能的直觉,使得DFT能够以可预测的精度描述真实的材料。LDA及其自旋解析扩展的改进是一个挑战。一种方法是引入电荷密度的梯度,然后引入动能密度,同时满足尽可能多的精确和渐近约束。或者,可以训练更高精确度的计算,还尝试了KS势的直接逼近。同样,通过绝热连接波动耗散定理,xc泛函的质量可以得到改善,但需要大量的计算代价。值得注意的是,在最简单的单电子系统中,大多数泛函是不正确的。许多近似值的局部性质会影响其他关键属性,从金属表面的像势到vks(r)的1 / r衰减和Rydberg级数原子和分子中的范德华相互作用。后者的相互作用对于从二维异质结构到分子和有机固体的材料尤为重要,已取得显著进展,并且出现了经验或第一性原理公式,极大地提高了预测准确性。一些对科学进步和技术创新最重要的材料仍具挑战性。例如混合价体系、磁性材料、镧系和锕系元素、缺陷和掺杂剂;最先进的实现通常需要对所研究的每种材料进行单独关注。第一性原理计算材料科学的力量现已变得显而易见,可用于研究日益复杂的材料特性和光谱学,作为指导,作者在Table 1 和Table 2 中概述了当今可以解决的现象学,提供了可用于进行这些预测的模型、理论和电子结构工具箱的指针。可以从DFT基态计算或激发态光谱公式中获得的光谱特性的精选概述。(来源:论文)
预测材料特性的一些关键的第一性原理方法概述。(来源:论文)
由于高压物理学的相关性和丰富的现象,体积和压力不仅是在周期边界条件下要控制的最简单的热力学变量,而且也是一些最强大的变量。实际上,第一性原理模拟已在高压材料领域产生了一些早期影响,毫不费力地施加了极端条件,这在地球上的实验中甚至是不可能的。温度是第一个主要的计算挑战,因为它需要探测原子振动和运动。第一性原理分子动力学将每个原子核视为一个可区分的实体,因此得出的统计数据就是麦克斯韦·玻耳兹曼(Maxwell Boltzmann)的经典粒子之一。集体变量和元动力学使人们能够捕获最相关的自由度并确定其自由能态。在合金中,可以通过计算作为化学势函数的自由能来确定相共存和组成温度相图,以研究其对成分的依赖性。对多相催化剂的探索推动了对新型材料的首次高通量搜索。通过多尺度或多物理模拟,可进一步拓宽第一性原理预测的材料特性范围。晶体的势能面适用于第一性原理计算,由于机器学习的进步,这种方法现在得到了极大的扩展,其中势能面可以即时学习,适合神经网络或在基于大量一致计算的核回归方法中进行特征化。最先进的方法还可以直接访问现实纳米结构和界面属性。多物理模拟的一个显著例子是迁移理论,通过主方程(例如Boltzmann或 Wigner方程)将激发的微观动力学抽象到其种群的动力学中,并扩展到非平衡动力学。结构材料见证了多尺度方法的发展,对于理解断裂、粘附、屈服强度和其他与材料微观结构相关的数量,第一性原理计算可以提供微观参数。光谱学是材料表征的核心:将精确的实验测量与第一性原理预测相匹配,可提供验证和理解,以及电子和原子现象及其宏观效应之间的因果关系。Table 2中总结了第一性原理模拟可访问的大多数技术。从广义上讲,有一些光谱可以通过 DFT 解决。固体中电子的拓扑性质在凝聚态物理和材料科学中发挥着重要作用。在电子结构方法中,几何相位随现代极化理论出现,受计算电子极化的需要驱动,这是一个不平凡的任务,因为周期固体中的位置算子是不确定的。值得注意的是,现代的磁化理论的一个含义是 xc 泛函也可能取决于诸如极化的宏观量。从Chern和量子自旋Hall绝缘体到Weyl半金属材料的拓扑性质正通过电子结构方法进行积极研究,甚至绘制了已知材料的整个图景。由于第一性原理模拟的准确性和效率,以及计算能力的指数可用性,不仅使计算材料的性能范围得到了极大的扩展,而且利用其设计和发现新材料已成为一个非常活跃和不断增长的研究领域。第一性原理设计和发现的四种主要方法:模型哈密顿量,结构预测,高通量和数据驱动。 在这种方法中,计算出的材料特性映射到显式参数模型上,与直接的第一性原理计算相比,可以被更广泛地探索。最著名的例子之一是合金理论,其形式为团簇膨胀(CE)。在CE中,晶格上任何原子构型的能量都以Ising-like的形式写成,即原子簇上单点自旋变量的乘积,其中每个项的系数表示该簇的有效相互作用。然后可以将所选置换安排集合的第一原理能量与CE拟合,从而产生相互作用。最早在20世纪80年代和90年代,在CE中使用第一性原理计算,该方法已被证明适用于广泛的系统。CE只是更广泛的模型构建方法的一个例子,但很好地代表了利用DFT计算来参数化更简单的哈密顿量的关键思想,然后可以更广泛地进行探索。材料科学的基本范式涉及结构与性质的关系:材料的结构(在长度尺度上)最终决定其性质。第一性原理计算需要结构作为输入,因此可以通过实验晶体结构的集合来辅助计算。现在已经有了一套计算方法,能够预测各种各样的晶体结构类型,通常只使用第一性原理计算,而不使用其他输入。由于可能的晶体结构对称性、细胞形状和基向量空间的维数很大,使得结构预测问题变得困难。大多数结构预测方法都基于尝试最小化高维空间上的能量的想法,最小化是通过一个高效的优化算法来实现的。成功的方法使用了多种方法,例如遗传算法、粒子群方法、随机结构搜索等。通过将第一性原理的总能量和实验衍射图形的匹配相结合的成本函数最小化,这些方法也可以应用于结构解决问题。另一种成功且广泛使用的材料设计方法是高通量 (HT) 第一性原理计算。HT从一次计算一种化合物的特性转移到对许多化合物进行大规模计算。在极端情况下,人们甚至可以尝试计算所有已知或预测化合物的特性。由于执行第一性原理计算的工作流程自动化,这些计算的自动化率很高,几乎没有或没有人工干预,以及第一性原理方法对大部分或所有元素周期表的适用性,使得HT计算成为可能。一些最早的 HT 计算已经结合了机器学习和数据驱动方法的想法。HT 第一性原理计算已被用于构建大型而强大的材料结构和属性数据库,最早的例子是 Materials Project、AFLOWlib和开放量子材料数据库 (OQMD)。Convex hulls。(来源:论文)
在大型数据集的发现中,通常采用一种筛选策略:从大量候选化合物开始,然后应用越来越严格的标准来筛选最有希望的化合物。选择标准优先考虑相对简单且计算成本低的数量。一个常见的判据是零温度基态相稳定性,这是通过凸包方法(convex hull approach)确定的。高通量筛选方法的例证。(来源:论文)
机器学习和数据驱动的方法可以极大地帮助寻找新材料。材料信息学方法通常基于三个不同的组成部分:材料数据资源;定量描述每种材料的表示;以及用于发现数据中的模式或预测新材料特性的机器学习算法。使用HT计算进行数据收集的好处是提高系统和指数数据池的大小,电子结构和机器学习中的开源、最先进的算法和软件包极大地促进了工作流的发现或预测。因此,关键的挑战在于材料表示的构建。该领域通常分为两类:一类仅是组成函数的表示,另一类是包含晶胞结构属性的表示。材料特性数据驱动的机器学习模型在发现具有良好性能的新材料方面已有大量的应用。许多这些模型也被用于指导HT搜索,通过有效地将这些模型导向更有希望的化合物。实际上,通过使用机器学习大大加快了新的稳定化合物的发现速度。- 由于模拟可以提出新材料,除了预测实验已知材料的新特性外,关键挑战是评估热力学稳定性、合成条件、工艺性以及预测特性对内在和外在缺陷的耐受性。最终可能需要通过更高级的电子结构方法或机器学习算法来提高DFT估计值来提高准确性。
- 在更基本的层面上,实现模拟的预测精度和捕捉材料的真实复杂性仍然是巨大的挑战。只有当基础理论被理解和编码时,模拟才能做出有意义的预测。
- 电子结构模拟将不断提高其相关性和影响力,加速、精简和集中我们在材料设计和发现方面的努力,提供越来越复杂的能力来预测和表征性能和性能,并在更加现实的条件和环境中解决那些由它们建造的设备。
最后,作者总结:「人们常说,人类时代的起名来源于代表它们特征的材料,而新材料的计算设计和发现,作为我们经济和社会的技术推动者,将在未来几十年牢牢占据中心舞台。无论是好是坏,如何处理它们仍然是人类的决定。」