Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

5天完成6个月实验量,加速催化研究,「自动驾驶」催化实验室Fast-Cat登Nature子刊

编辑 | 紫罗

「自动驾驶实验室」是未来?

今年 1 月底,荷兰阿姆斯特丹大学开发自主化学合成 AI 机器人「RoboChem」。一周内,可以优化大约 10~20 个分子的合成。这需要博士生几个月的时间。

还有去年 DeepMind 团队开发的自主实验室 A-Lab,17 天自主合成 41 种新化合物。

卡内基梅隆大学的 Coscientist,自主设计、规划和执行复杂的科学实验......

现在,来自美国北卡罗来纳州立大学和全球特种材料公司伊士曼化学公司(Eastman Chemical Company)合作,开发了一个「自动驾驶」催化实验室:Fast-Cat,利用 AI 和自动化系统,对化学研究和制造中使用的催化反应进行深入分析。

Fast-Cat 可以在五天内提供比 6 个月的传统测试更多的信息。

Fast-Cat 是完全自主的,利用人工智能和自动化系统连续进行高温、高压、气液反应。自主技术还分析每个反应的输出,以确定(无需人工干预)不同变量如何影响每个实验的结果。

麻省理工学院的段辰儒博士告诉 ScienceAI,「Fast-Cat 展示了贝叶斯优化和高通量实验的有机结合,帮助化学家更加高效的筛选过渡金属催化剂中的配体。我已经可以畅想类似的高通量实验工作流将在全新催化剂设计,尤其是在找到当前贵金属催化材料更为绿色的替代中发挥重要的作用。」

相关研究以「Autonomous reaction Pareto-front mapping with a self-driving catalysis laboratory」为题,于 2024 年 2 月 27 日发表在《Nature Chemical Engineering》杂志上。

图片

论文链接:https://www.nature.com/articles/s44286-024-00033-5

传统的催化研究耗时耗力

配体广泛用于催化,加速和控制从工业化学到制药制造等过程中化学反应的选择性。

配体在过渡金属介导的均相催化剂的化学转化中起着至关重要的作用。尽管配体在均相催化中的作用无可争议,但配体的发现和开发却是一项极具挑战和资源密集型的工作。

从行业角度来看,希望获得尽可能高的产量和选择性。在进行催化反应时采取的具体步骤会影响产率和灵敏度,因此工业化学家花费大量时间和精力试图找到实现最理想反应结果所需的参数

铑 (Rh) 催化的烯烃加氢甲酰化生产直链和支链醛是当代工业过程中的一种重要均相反应,具有广泛的应用范围,从日用化学品到特种药品和香料。

「问题在于,传统的催化剂发现和开发技术是时间、材料和劳动力密集型的。」该研究的通讯作者、北卡罗来纳州立大学化学和生物分子工程副教授 Milad Abolhasani 说。

这些技术在很大程度上依赖于间歇式反应器的手动样品处理,以及人类的直觉和经验来推动实验计划。除了材料效率低下之外,这种依赖于人工的催化剂开发方法在执行反应、表征产品和做出下一个实验的决定之间产生了很大的时间差距。

Abolhasani 说,「这就是我们创建 Fast-Cat 的原因。我们现在能够在五天内更好地了解特定配体的表现,以前可能需要 6 个月。」

图片

图 1:已开发的自动驾驶催化实验室技术示意图。(来源:论文)

自动驾驶实验室研究进展

使用自动驾驶实验室 (Self-driving laboratory,SDL) 进行闭环自主反应探索是一项快速新兴的技术,用于加速材料和分子发现和开发。与传统的手动实验策略相比,这种自主实验策略可以加速多目标工艺优化,以满足特定工艺要求。

SDL 的核心在于由机器学习 (ML) 算法编排的实验数据的自动生成(自动化)。在每次实验中,SDL 的大脑(即 ML 算法)都会预测系统响应,并迭代地获取一组改进的反应条件,直到达到预期目标。

由于缺乏过渡金属催化均相催化的综合实验数据和元数据,因此需要开发强大的实验平台来生成高质量的大数据和可扩展的实验数据,以利用 SDL 的数据科学工具。

流动反应器在生成大量高质量实验数据方面具有许多优势,这些数据可以输入到 SDL 的数据科学工具中,从而促进加速催化剂的发现和开发。

基于实时实验数据见解快速迭代、探索和优化催化剂性能的能力是配备流动反应器的 SDL 提供的主要优势。

「自动驾驶」催化实验室:Fast-Cat

在此,研究人员提出了一种用于催化加速和测试的全自动自动驾驶流体技术(Fast-Cat)。

Fast-Cat 采用闭环均相催化系统,利用流动化学平台自主研究和加速催化剂/配体系统的探索。Fast-Cat 结合了模块化气液流动反应器、在线反应表征、先进的过程自动化和机器学习技术,以加速特种和精细化学品的配体发现、催化剂基准测试和工艺开发。

具体来说,研究人员利用 Fast-Cat 在铑和各类磷基配体存在下对合成气(CO 和 H2)与烯烃(1-辛烯)之间的加氢甲酰化反应进行快速帕累托前沿(Pareto-front)识别。

在对 Fast-Cat 与大型传统间歇反应器的硬件进行开发、表征和基准测试后,研究人员用它来快速绘制烯烃加氢甲酰化的配体-区域选择性-产率(ligand–regioselectivity–yield)关系。

在仅 5 天的连续自主实验(45 个反应)内,无需人工干预,Fast-Cat 通过快速识别 1-辛烯加氢甲酰化中任何所需配体的帕累托前沿,展示了其强大功能。

Fast-Cat 能够在人为干预最少的情况下,进行自主配体基准测试和多目标催化剂性能评估。

Fast-Cat 使用之前所有实验的结果(包括成功的和失败的),来决定下一步要做哪个实验。

「Fast-Cat 的人工智能不断发展,从已经进行的实验中学习,」Abolhasani 说。

通俗地说,用户让 Fast-Cat 知道它必须从哪些配体和前体化学物质开始,然后通过 60 多个实验看看它能学到多少东西。

「我们花了很多时间微调 Fast-Cat 的 AI 模型,来优化它,从而尽可能广泛地了解不同参数如何影响使用特定配体的催化反应的选择性和产率。」Abolhasani 说。

Fast-Cat 的硬件

Fast-Cat 的自动化流动化学平台包括五个模块,包括前体装载/配制、前体再填充、流动反应器、反应采样和使用气相色谱法的在线表征(GC)。

Fast-Cat 的 ML 大脑

Fast-Cat 的数字组件包括流动加氢甲酰化反应的自动数据处理和自动实验选择。Fast-Cat 的 ML 序列首先读取先前评估的实验条件的内部数据库

然后,使用 Fast-Cat 生成的实验数据自动创建当前反应系统的置信模型 (DNN)。

研究使用的主要采集函数是批处理噪声预期超体积改进(qNEHVI),这是相对于经典贝叶斯单目标预期改进的多目标策略。

图片

图示:使用多目标贝叶斯优化技术的 Fast-Cat 自动实验选择工作流程概述。(来源:论文)

为了进行概念验证测试,研究人员使用 Fast-Cat 来表征研究文献中已发现的六种配体的催化性能。报告了所选加氢甲酰化配体的六个完整帕累托前沿优化活动的反应数据和元数据,包括所有测试的反应。

Abolhasani 说,「我们还花了很多时间来确保 Fast-Cat 的研究结果具有可扩展性。Fast-Cat 以极小的样本量进行实验。但如果我们想让它的发现与实际应用相关,我们需要知道 Fast-Cat 的发现适用于与工业制造相关的大规模反应。」

为了证明 Fast-Cat 的知识可扩展性,研究人员选择具有高和低区域选择性值以及产率高于 50% 的配体和加氢甲酰化反应条件在间歇反应器(10 毫升高压釜)中进行测试。

图片

图示:Fast-Cat 对不同测试配体的自主 Pareto-front 图。(来源:论文)

知识可扩展性结果表明,生成的知识可以直接从流程转移到间歇反应器,并保持一致的反应结果。这一结果缩小了实验室规模的 SDL 驱动的发现与行业相关的扩大生产之间的知识转移和可扩展性差距。

此外,研究还重点介绍了 Fast-Cat 的一个方面,即生成高质量的实验数据,用于构建所研究的均相催化反应的数字孪生。使用 Fast-Cat 内部生成的实验数据训练的数字孪生作为虚拟表示,有助于理解潜在的反应机制。然后,利用从数字孪生中收集的信息,探索了控制产物醛产率和区域选择性的关键工艺参数

加速学术界和工业界的催化发现

由于 Fast-Cat 是模块化的,未来与机器人化学工作站和其他自动化工具的集成将有助于扩展可用于反应空间探索的材料库,从而允许离散变量筛选和优化活动。

论文共同作者、全球特种材料公司伊士曼(Eastman)的全球外部创新经理 Dawn Mason 说:「我们第一次能够快速评估各种参数,并真正深入了解如何影响每个配体的性能。令人难以置信的是,我们只花了五天的时间来评估每个项目。」

伊士曼企业创新副总裁 Jeff Carbeck 表示:「对于化学和制药行业来说,更好地了解如何影响其在制造过程中使用的催化过程具有真正的价值。Fast-Cat 提供了这种理解,并且快速、高效,同时使用少量的相关配体和化学前体。换句话说,它快速、廉价且非常有效。」

研究人员已将软件和硬件公开,以便可以使用 Fast-Cat 来促进更多研究。

「我们希望其他研究人员能够采用这项技术来加速学术界和工业界的催化发现。」Abolhasa说

参考内容:https://phys.org/news/2024-02-ai-driven-lab-catalysis.html

https://news.ncsu.edu/2024/02/ai-driven-lab-speeds-catalysis-research/

理论
相关数据
DeepMind机构

DeepMind是一家英国的人工智能公司。公司创建于2010年,最初名称是DeepMind科技(DeepMind Technologies Limited),在2014年被谷歌收购。在2010年由杰米斯·哈萨比斯,谢恩·列格和穆斯塔法·苏莱曼成立创业公司。继AlphaGo之后,Google DeepMind首席执行官杰米斯·哈萨比斯表示将研究用人工智能与人类玩其他游戏,例如即时战略游戏《星际争霸II》(StarCraft II)。深度AI如果能直接使用在其他各种不同领域,除了未来能玩不同的游戏外,例如自动驾驶、投资顾问、音乐评论、甚至司法判决等等目前需要人脑才能处理的工作,基本上也可以直接使用相同的神经网上去学而习得与人类相同的思考力。

https://deepmind.com/
机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

基准技术

一种简单的模型或启发法,用作比较模型效果时的参考点。基准有助于模型开发者针对特定问题量化最低预期效果。

参数技术

在数学和统计学裡,参数(英语:parameter)是使用通用变量来建立函数和变量之间关系(当这种关系很难用方程来阐述时)的一个数量。

数据科学技术

数据科学,又称资料科学,是一门利用数据学习知识的学科,其目标是通过从数据中提取出有价值的部分来生产数据产品。它结合了诸多领域中的理论和技术,包括应用数学、统计、模式识别、机器学习、数据可视化、数据仓库以及高性能计算。数据科学通过运用各种相关的数据来帮助非专业人士理解问题。

规划技术

人工智能领域的「规划」通常是指智能体执行的任务/动作的自动规划和调度,其目的是进行资源的优化。常见的规划方法包括经典规划(Classical Planning)、分层任务网络(HTN)和 logistics 规划。

数据库技术

数据库,简而言之可视为电子化的文件柜——存储电子文件的处所,用户可以对文件中的数据运行新增、截取、更新、删除等操作。 所谓“数据库”系以一定方式储存在一起、能予多个用户共享、具有尽可能小的冗余度、与应用程序彼此独立的数据集合。

数字孪生技术

数字孪生(*Digital twin*)指可用于各种目的物理资产(物理孪生,physical twin)、过程、人员、场所、系统和设备的数字副本。

推荐文章
暂无评论
暂无评论~