编辑 | 萝卜皮
从计算机芯片、电池到太阳能电池板等现代技术都依赖于无机晶体。开发这些新技术,所需的晶体必须稳定,否则材料就会分解,而每个新的、稳定的晶体背后可能需要研究人员数月或者更久的艰苦实验。
Google DeepMind 材料团队分享了 220 万颗新晶体的发现,相当于近 800 年的知识。该团队推出了新的深度学习工具,用于材料探索的图网络 (GNoME),可通过预测新材料的稳定性来显著提高发现的速度和效率。
论文链接:https://www.nature.com/articles/s41586-023-06735-9
使用 GNoME,科学家可以使人类已知的技术上可行的材料数量成倍增加。在其 220 万个预测中,有 38 万个是最稳定的。这些候选材料中有潜力开发未来变革性技术,包括超导体、超级计算机供电和下一代电池等等。
GNoME 展示了利用人工智能大规模发现和开发新材料的潜力。世界各地实验室的外部研究人员在并行工作中独立实验创建了 736 个此类新结构。
劳伦斯伯克利国家实验室的研究团队与 Google DeepMind 合作,开发了一个将机器人技术与人工智能 (AI) 相结合的自主新材料发现合成系统,被称为 A-Lab,可用于设计材料配方,其中包括一些可能用于汽车电池或太阳能电池的材料。它进行合成并分析产品的所有过程都无需人工干预。
这些进步有望大大加速清洁能源技术、下一代电子产品和许多其他应用材料的发展。「我们身边的许多技术,包括电池和太阳能电池,都可以通过更好的材料来真正改进。」 伦敦 Google DeepMind 材料发现团队的领导者 Ekin Dogus Cubuk 说。
「科学发现是人工智能的下一个前沿领域。」纽约伊萨卡康奈尔大学人工智能科学研究所联席主任 Carla Gomes 评论道,「这就是为什么我觉得这如此令人兴奋。」
相关研究分别以「Scaling deep learning for materials discovery」和「An autonomous laboratory for the accelerated synthesis of novel materials」为题,于 2023 年 11 月 29 日发布在《Nature》。
超大尺寸材料发现
经过几个世纪的艰苦实验室工作,化学家已经合成了数十万种无机化合物——一般来说,这些材料不是基于碳原子链,而碳原子链是有机化学的特征。然而研究表明,数十亿种相对简单的无机材料仍有待发现。那么从哪里开始寻找呢?
Google DeepMind 材料发现团队展示了大规模训练的图网络可以达到前所未有的泛化水平,从而将材料发现的效率提高一个数量级。他们开发的GNoME,在对从材料项目和类似数据库中抓取的数据进行训练后(其中包括 48,000 个稳定晶体)调整了已知材料的成分,得出了 220 万种潜在化合物,其中许多结构并不在人类之前的化学直觉之内。在计算这些材料是否稳定并预测其晶体结构后,系统最终统计出 381,000 种新无机化合物,将其添加到材料项目数据库中。
该工作代表了人类已知的稳定材料的数量级扩展。在稳定结构中,有 736 个已通过独立实验实现。数亿次第一原理计算的规模和多样性也释放了下游应用程序的建模能力,特别是导致高度准确和强大的学习原子间势,可用于凝聚相分子动力学模拟和离子电导率的高保真零样本预测。
图:GNoME 预测的材料之一 Ba6Nb7O21 的晶体结构。(来源:论文)
至关重要的是,GNoME 使用多种策略来预测比以前的 AI 系统更多的材料。例如,与其将材料中的所有钙离子都改为镁离子,不如只替换其中的一半,或者尝试更广泛的不寻常原子交换。如果这些调整不起作用也没有问题,因为系统会清除所有不稳定的因素,并从错误中吸取教训。「这就像用于材料发现的 ChatGPT。」Gomes 说。
高效准确的机器人
预测某种材料的存在是一回事,但在实验室中实际制造它又是另一回事。这就是 A-Lab 的用武之地。「我们现在有能力快速制造我们通过计算得出的这些新材料。」A-Lab 团队的领导者、劳伦斯伯克利国家实验室和加州大学伯克利分校的材料科学家 Gerbrand Ceder 说道。
位于劳伦斯伯克利国家实验室的 A-Lab 使用最先进的机器人技术来混合和加热粉末状固体成分,然后分析产品从而检查该过程是否有效。该项目耗资 200 万美元,历时 18 个月建成。该项目但最大的挑战在于使用人工智能使系统真正自主,以便使 A-Lab 可以计划实验、解释数据并就如何改进综合做出决策。「这些机器人看起来非常有趣,但创新实际上是在幕后进行的。」Ceder 说。
Ceder 的团队从 Materials Project 数据库中识别出 58 种预计稳定的目标化合物,将它们与 GNoME 数据库进行交叉检查,并将目标移交给 A-Lab 的机器学习模型。通过梳理 30,000 多个已发布的合成程序,A-Lab 可以评估每个目标与现有材料的相似性,并提出制造所需的成分和反应温度。
总之,A-Lab 花了 17 天的时间,从 58 个目标中分离出了 41 种新型化合物,其中包括各种氧化物和磷酸盐。它的合成配方是由根据文献训练的自然语言模型提出的,并使用基于热力学的主动学习方法进行优化。同时,对合成失败的分析提供了直接且可行的建议,从而进一步改进当前的材料筛选和合成设计技术。高成功率证明了人工智能驱动平台在自主材料发现方面的有效性,并推动了计算、历史知识和机器人技术的进一步整合。
视频:A-Lab 操作演示。(来源:论文)
英国利物浦大学材料创新工厂的学术主任 Andy Cooper 表示,很明显,GNoME 等系统可以做出比自主实验室更多的计算预测。「我们真正需要的是告诉我们要做什么的计算。」Cooper 说。为此,人工智能系统必须准确计算更多预测材料的化学和物理特性。
模拟、机器学习和机器人技术的进步相互交叉,形成了“专家系统”,通过其自动化组件的总和,将自主性显示为一种新兴的品质。A-Lab 通过将现代理论驱动和数据驱动的机器学习技术与模块化工作流程相结合来证明这一点,该工作流程可以以最少的人力投入发现新颖的材料。
从持续实验中吸取的经验教训可以通过系统的数据生成和收集为系统本身和更大的社区提供信息。A-Lab 的系统性提供了一个独特的机会来回答有关控制新型材料可合成性的因素的基本问题,充当实验预言机来验证基于材料项目等丰富数据资源做出的预测。
与此同时,A-Lab 仍在运行反应,并将结果添加到材料项目中,以便世界各地的科学家可以利用它们来为自己的研究提供便利。这种不断增长的缓存可能是该系统最大的资产,Ceder 说:「它本质上是常见固体反应性的地图。这就是改变世界的东西——不是 A-Lab 本身,而是它产生的知识和信息。」
相关报道: