Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

发现38万种新材料、17天自主合成41种新化合物,DeepMind一日两篇论文登上Nature

图片

编辑 | 萝卜皮

从计算机芯片、电池到太阳能电池板等现代技术都依赖于无机晶体。开发这些新技术,所需的晶体必须稳定,否则材料就会分解,而每个新的、稳定的晶体背后可能需要研究人员数月或者更久的艰苦实验。

Google DeepMind 材料团队分享了 220 万颗新晶体的发现,相当于近 800 年的知识。该团队推出了新的深度学习工具,用于材料探索的图网络 (GNoME),可通过预测新材料的稳定性来显著提高发现的速度和效率。

图片

论文链接:https://www.nature.com/articles/s41586-023-06735-9

使用 GNoME,科学家可以使人类已知的技术上可行的材料数量成倍增加。在其 220 万个预测中,有 38 万个是最稳定的。这些候选材料中有潜力开发未来变革性技术,包括超导体、超级计算机供电和下一代电池等等。

GNoME 展示了利用人工智能大规模发现和开发新材料的潜力。世界各地实验室的外部研究人员在并行工作中独立实验创建了 736 个此类新结构。

劳伦斯伯克利国家实验室的研究团队与 Google DeepMind 合作,开发了一个将机器人技术人工智能 (AI) 相结合的自主新材料发现合成系统,被称为 A-Lab,可用于设计材料配方,其中包括一些可能用于汽车电池或太阳能电池的材料。它进行合成并分析产品的所有过程都无需人工干预。

图片

论文链接:https://www.nature.com/articles/s41586-023-06734-w

这些进步有望大大加速清洁能源技术、下一代电子产品和许多其他应用材料的发展。「我们身边的许多技术,包括电池和太阳能电池,都可以通过更好的材料来真正改进。」 伦敦 Google DeepMind 材料发现团队的领导者 Ekin Dogus Cubuk 说。

「科学发现是人工智能的下一个前沿领域。」纽约伊萨卡康奈尔大学人工智能科学研究所联席主任 Carla Gomes 评论道,「这就是为什么我觉得这如此令人兴奋。」

相关研究分别以「Scaling deep learning for materials discovery」和「An autonomous laboratory for the accelerated synthesis of novel materials」为题,于 2023 年 11 月 29 日发布在《Nature》。

超大尺寸材料发现

经过几个世纪的艰苦实验室工作,化学家已经合成了数十万种无机化合物——一般来说,这些材料不是基于碳原子链,而碳原子链是有机化学的特征。然而研究表明,数十亿种相对简单的无机材料仍有待发现。那么从哪里开始寻找呢?

Google DeepMind 材料发现团队展示了大规模训练的图网络可以达到前所未有的泛化水平,从而将材料发现的效率提高一个数量级。他们开发的GNoME,在对从材料项目和类似数据库中抓取的数据进行训练后(其中包括 48,000 个稳定晶体)调整了已知材料的成分,得出了 220 万种潜在化合物,其中许多结构并不在人类之前的化学直觉之内。在计算这些材料是否稳定并预测其晶体结构后,系统最终统计出 381,000 种新无机化合物,将其添加到材料项目数据库中。

该工作代表了人类已知的稳定材料的数量级扩展。在稳定结构中,有 736 个已通过独立实验实现。数亿次第一原理计算的规模和多样性也释放了下游应用程序的建模能力,特别是导致高度准确和强大的学习原子间势,可用于凝聚相分子动力学模拟和离子电导率的高保真零样本预测。

图片

图:GNoME 预测的材料之一 Ba6Nb7O21 的晶体结构。(来源:论文)

至关重要的是,GNoME 使用多种策略来预测比以前的 AI 系统更多的材料。例如,与其将材料中的所有钙离子都改为镁离子,不如只替换其中的一半,或者尝试更广泛的不寻常原子交换。如果这些调整不起作用也没有问题,因为系统会清除所有不稳定的因素,并从错误中吸取教训。「这就像用于材料发现的 ChatGPT。」Gomes 说。

高效准确的机器人

预测某种材料的存在是一回事,但在实验室中实际制造它又是另一回事。这就是 A-Lab 的用武之地。「我们现在有能力快速制造我们通过计算得出的这些新材料。」A-Lab 团队的领导者、劳伦斯伯克利国家实验室和加州大学伯克利分校的材料科学家 Gerbrand Ceder 说道。

位于劳伦斯伯克利国家实验室的 A-Lab 使用最先进的机器人技术来混合和加热粉末状固体成分,然后分析产品从而检查该过程是否有效。该项目耗资 200 万美元,历时 18 个月建成。该项目但最大的挑战在于使用人工智能使系统真正自主,以便使 A-Lab 可以计划实验、解释数据并就如何改进综合做出决策。「这些机器人看起来非常有趣,但创新实际上是在幕后进行的。」Ceder 说。

Ceder 的团队从 Materials Project 数据库中识别出 58 种预计稳定的目标化合物,将它们与 GNoME 数据库进行交叉检查,并将目标移交给 A-Lab 的机器学习模型。通过梳理 30,000 多个已发布的合成程序,A-Lab 可以评估每个目标与现有材料的相似性,并提出制造所需的成分和反应温度。

图片

图:A-Lab。(来源:论文)

总之,A-Lab 花了 17 天的时间,从 58 个目标中分离出了 41 种新型化合物,其中包括各种氧化物和磷酸盐。它的合成配方是由根据文献训练的自然语言模型提出的,并使用基于热力学的主动学习方法进行优化。同时,对合成失败的分析提供了直接且可行的建议,从而进一步改进当前的材料筛选和合成设计技术。高成功率证明了人工智能驱动平台在自主材料发现方面的有效性,并推动了计算、历史知识和机器人技术的进一步整合。

视频:A-Lab 操作演示。(来源:论文)

英国利物浦大学材料创新工厂的学术主任 Andy Cooper 表示,很明显,GNoME 等系统可以做出比自主实验室更多的计算预测。「我们真正需要的是告诉我们要做什么的计算。」Cooper 说。为此,人工智能系统必须准确计算更多预测材料的化学和物理特性。

模拟、机器学习机器人技术的进步相互交叉,形成了“专家系统”,通过其自动化组件的总和,将自主性显示为一种新兴的品质。A-Lab 通过将现代理论驱动和数据驱动的机器学习技术与模块化工作流程相结合来证明这一点,该工作流程可以以最少的人力投入发现新颖的材料。

从持续实验中吸取的经验教训可以通过系统的数据生成和收集为系统本身和更大的社区提供信息。A-Lab 的系统性提供了一个独特的机会来回答有关控制新型材料可合成性的因素的基本问题,充当实验预言机来验证基于材料项目等丰富数据资源做出的预测。

与此同时,A-Lab 仍在运行反应,并将结果添加到材料项目中,以便世界各地的科学家可以利用它们来为自己的研究提供便利。这种不断增长的缓存可能是该系统最大的资产,Ceder 说:「它本质上是常见固体反应性的地图。这就是改变世界的东西——不是 A-Lab 本身,而是它产生的知识和信息。」

相关报道:

https://www.nature.com/articles/d41586-023-03745-5
https://deepmind.google/discover/blog/millions-of-new-materials-discovered-with-deep-learning/
https://twitter.com/demishassabis/status/1729995611443769823
产业机器学习DeepMind
相关数据
DeepMind机构

DeepMind是一家英国的人工智能公司。公司创建于2010年,最初名称是DeepMind科技(DeepMind Technologies Limited),在2014年被谷歌收购。在2010年由杰米斯·哈萨比斯,谢恩·列格和穆斯塔法·苏莱曼成立创业公司。继AlphaGo之后,Google DeepMind首席执行官杰米斯·哈萨比斯表示将研究用人工智能与人类玩其他游戏,例如即时战略游戏《星际争霸II》(StarCraft II)。深度AI如果能直接使用在其他各种不同领域,除了未来能玩不同的游戏外,例如自动驾驶、投资顾问、音乐评论、甚至司法判决等等目前需要人脑才能处理的工作,基本上也可以直接使用相同的神经网上去学而习得与人类相同的思考力。

https://deepmind.com/
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

专家系统技术

专家系统(ES)是人工智能最活跃和最广泛的领域之一。专家系统定义为:使用人类专家推理的计算机模型来处理现实世界中需要专家作出解释的复杂问题,并得出与专家相同的结论。简言之,如图1所示,专家系统可视作“知识库(knowledge base)”和“推理机(inference machine)” 的结合。

机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

机器人技术技术

机器人学(Robotics)研究的是「机器人的设计、制造、运作和应用,以及控制它们的计算机系统、传感反馈和信息处理」 [25] 。 机器人可以分成两大类:固定机器人和移动机器人。固定机器人通常被用于工业生产(比如用于装配线)。常见的移动机器人应用有货运机器人、空中机器人和自动载具。机器人需要不同部件和系统的协作才能实现最优的作业。其中在硬件上包含传感器、反应器和控制器;另外还有能够实现感知能力的软件,比如定位、地图测绘和目标识别。之前章节中提及的技术都可以在机器人上得到应用和集成,这也是人工智能领域最早的终极目标之一。

数据库技术

数据库,简而言之可视为电子化的文件柜——存储电子文件的处所,用户可以对文件中的数据运行新增、截取、更新、删除等操作。 所谓“数据库”系以一定方式储存在一起、能予多个用户共享、具有尽可能小的冗余度、与应用程序彼此独立的数据集合。

主动学习技术

主动学习是半监督机器学习的一个特例,其中学习算法能够交互式地查询用户(或其他信息源)以在新的数据点处获得期望的输出。 在统计学文献中,有时也称为最佳实验设计。

图网技术

ImageNet 是一个计算机视觉系统识别项目, 是目前世界上图像识别最大的数据库。

图网络技术

2018年6月,由 DeepMind、谷歌大脑、MIT 和爱丁堡大学等公司和机构的 27 位科学家共同提交了论文《Relational inductive biases, deep learning, and graph networks》,该研究提出了一个基于关系归纳偏置的 AI 概念:图网络(Graph Networks)。研究人员称,该方法推广并扩展了各种神经网络方法,并为操作结构化知识和生成结构化行为提供了新的思路。

推荐文章
暂无评论
暂无评论~