Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

厦大团队材料预测迁移学习范式登Nature子刊,发现高性能催化剂

图片

编辑 | KX

传统的材料发现依赖反复试验或偶然发现,效率低下且成本高昂。

AI 在发现新型催化剂方面潜力巨大。然而,受到算法的选择,以及数据质量和数量的影响。

在此,来自厦门大学、深圳大学、武汉大学、南京航空航天大学和英国利物浦大学的研究团队开发了一种迁移学习范式,结合了预训练模型、集成学习主动学习,能够预测未被发现的钙钛矿氧化物,并增强该反应的通用性。

通过筛选 16,050 种成分,鉴定和合成了 36 种新的钙钛矿氧化物,其中包括 13 种纯钙钛矿结构。

Pr0.1Sr0.9Co0.5Fe0.5O3(PSCF)和 Pr0.1Sr0.9Co0.5Fe0.3Mn0.2O3(PSCFM)在 10 mA cm^-2 时分别表现出 327 mV 和 315 mV 的低过电位。电化学测量表明,两种材料中 O-O 耦合的吸附质演化机制(AEM)和晶格氧机制(LOM)共存。

该研究为加速发现和开发用于该反应的高性能钙钛矿氧化物电催化剂铺平了道路。

相关研究以「Transfer learning guided discovery of efficient perovskite oxide for alkaline water oxidation」为题,于 7 月 26 日发布在《Nature Communications》上。

图片

论文链接:https://www.nature.com/articles/s41467-024-50605-5

当前材料发现方法的局限性

钙钛矿氧化物材料在增值化学品的绿色电合成中起着关键作用,这是实现碳中和的关键一步。

一个值得关注的应用是它们在析氧反应(OER)中的应用,该反应可以与各种阴极反应相结合。然而,OER 在动力学上仍然很缓慢,涉及 4 步质子-电子耦合转移过程。因此,开发高效且经济的电催化剂至关重要。

先前的研究表明,将各种阳离子(Ce、Pr、Cr、Sr、V、W、Co、Fe、Mn、Nb、Mg 等)掺入钙钛矿氧化物的 A 位或 B 位,可以有效调节局部配位环境和电子结构,从而提高电催化性能。然而,由于材料发现的反复试验方法效率低下,其具体化学成分仍未得到探索。

高通量密度泛函理论 (DFT) 计算通常需要预先了解特定的算法或方法,从而阻碍了不同系统之间的数据统一,限制了其通用性。

AI 在发现新型电催化剂方面有巨大潜力。然而,基于特征选择和简化的 ML 算法通常会消除不太重要的描述符,不可避免地导致信息丢失和预测准确性降低。此外,在分析同一数据集的相对重要性时,不同的算法经常会产生不一致的结果。

除了算法的选择之外,数据的质量和数量在确定基于 ML 的预测的准确性方面也起着至关重要的作用。从 DFT 派生的传统模拟数据库通常仅限于单个或几个类似的系统,从而限制了所提取知识的适用性和普遍性。此外,由于缺乏普遍接受的实验方法报告标准,因此实验数据相对稀缺且难以整合。

迁移学习范式

为了应对这一挑战,厦大团队提出了一种以钙钛矿氧化物电催化剂的阳离子信息为中心的强大迁移学习范式。该方法利用预训练的模型有效地将 OER 数据与来自不同研究领域的大量数据集相结合,涵盖了更广泛的钙钛矿成分。

采用集成方法来组合通过结合领域知识和无监督学习技术确定的不同子簇衍生的模型。该策略促进了不同材料系统之间的知识转移,从而显著提高了预测准确性。

所提出的迁移学习范式包括七个步骤:数据提取、阳离子编码、特征嵌入、聚类、局部预测、全局集成和主动学习闭环实验验证。

由于 OER 钙钛矿氧化物数据有限,研究人员还收集了非 OER 钙钛矿氧化物的数据。这种方法将数据集从 94 个条目扩展到 140 个条目,增加了 48.9%。丰富的数据集涵盖了多种特征,包括材料成分、氧空位浓度和化学价态分布。

图片

图示:迁移学习工作流程,发现用于析氧反应的钙钛矿电催化剂。(来源:论文)

实验验证和主动学习

研究人员对候选材料进行了实验验证。由于预测结构熵较高的钙钛矿氧化物材料的性质本身就很复杂,最初的预测仅限于四元和五元组成。

从超过 500 万个预测点中选择了 30 种化学式进行实验验证。重要的是,预测组成为 PSCF 的材料将是一种高性能材料,其最低过电位

为 340.81 mV(364.80 ± 18.55 mV)。初步线性扫描伏安法 (LSV) 评估证实了 PSCF 的过电位为 327 mV。

图片

图示:迁移学习模型的评估和预测。(来源:论文)

从第二轮预测中,主动学习方法的结合将预测能力扩展到更复杂的六元材料系统,PSCF 中 Mn 部分取代 Fe 的 PSCFM,实现了 302.92 mV(322.75 mV ± 14.09 mV)的最小预测过电位。随后,所有这些选定的材料都经过制造、XRD 筛选并通过 LSV 测量进行评估。与预测一致,PSCFM 在 10 mA cm^−2 时显示出 315 mV 的降低过电位,验证了模型的可靠性。

主动学习策略的进一步验证涉及将精确编码的 PSCFM 价态分布纳入第三个预测周期的训练集。

研究表明,尽管六元系统本身就很复杂,但应用主动学习策略可以提高预测准确性。

图片

图示:Mn 掺杂对钙钛矿氧化物 OER 的影响。(来源:论文)

综合表征表明,晶格氧在促进 OER 过程中的 O-O 偶联方面起着关键作用。DFT 计算进一步阐明了这种增强 OER 活性的机制基础。Mn 融入 PSCF 可增强 Co 反应位点的稳定性,同时通过晶格氧机制 (LOM) 途径降低 Mn-O-Co 基序上的反应势垒。

该方法证明了迁移学习主动学习在克服数据限制和准确预测 OER 催化剂方面的有效性。研究建立了强大的 ML 范式,为加速高性能 OER 催化剂的开发铺平了道路。

注:封面来自网络

理论主动学习集成学习迁移学习大模型
相关数据
集成学习技术

集成学习是指使用多种兼容的学习算法/模型来执行单个任务的技术,目的是为了得到更佳的预测表现。集成学习的主要方法可归类为三大类: 堆叠(Stacking)、提升(Boosting) 和 装袋(Bagging/bootstrapaggregating)。其中最流行的方法包括随机森林、梯度提升、AdaBoost、梯度提升决策树(GBDT)和XGBoost。

数据库技术

数据库,简而言之可视为电子化的文件柜——存储电子文件的处所,用户可以对文件中的数据运行新增、截取、更新、删除等操作。 所谓“数据库”系以一定方式储存在一起、能予多个用户共享、具有尽可能小的冗余度、与应用程序彼此独立的数据集合。

集成方法技术

在统计学和机器学习中,集成方法使用多种学习算法来获得比单独使用任何组成学习算法更好的预测性能。

特征选择技术

在机器学习和统计学中,特征选择(英语:feature selection)也被称为变量选择、属性选择或变量子集选择。 它是指:为了构建模型而选择相关特征(即属性、指标)子集的过程。

主动学习技术

主动学习是半监督机器学习的一个特例,其中学习算法能够交互式地查询用户(或其他信息源)以在新的数据点处获得期望的输出。 在统计学文献中,有时也称为最佳实验设计。

聚类技术

将物理或抽象对象的集合分成由类似的对象组成的多个类的过程被称为聚类。由聚类所生成的簇是一组数据对象的集合,这些对象与同一个簇中的对象彼此相似,与其他簇中的对象相异。“物以类聚,人以群分”,在自然科学和社会科学中,存在着大量的分类问题。聚类分析又称群分析,它是研究(样品或指标)分类问题的一种统计分析方法。聚类分析起源于分类学,但是聚类不等于分类。聚类与分类的不同在于,聚类所要求划分的类是未知的。聚类分析内容非常丰富,有系统聚类法、有序样品聚类法、动态聚类法、模糊聚类法、图论聚类法、聚类预报法等。

迁移学习技术

迁移学习 是属于机器学习的一种研究领域。它专注于存储已有问题的解决模型,并将其利用在其他不同但相关问题上。比如说,用来辨识汽车的知识(或者是模型)也可以被用来提升识别卡车的能力。计算机领域的迁移学习和心理学常常提到的学习迁移在概念上有一定关系,但是两个领域在学术上的关系非常有限。

推荐文章
暂无评论
暂无评论~