基于先前积累的数据和已知物理原理的自动化科学发现,是人工智能最令人兴奋的应用之一,这种自动化的假设创建和验证可以帮助科学家研究复杂的现象,而传统的物理直觉可能会失败。近日,来自新加坡国立大学、新加坡科技研究局(A*STAR)、南洋理工大学和中国科学院的研究团队,开发了一个基于广义 Onsager 原理的人工智能平台:S-OnsagerNet,可以直接从对任意随机耗散系统的微观轨迹的观察中学习其宏观动力学描述。该方法同时构建了简化的热力学坐标,并解释这些坐标上的动力学。研究人员通过理论研究和实验验证长聚合物链在外部应用场中的拉伸来证明其有效性。具体来说,学习了三个可解释的热力学坐标并构建了聚合物拉伸的动态景观,包括稳定态和过渡态的识别以及拉伸速率的控制。该通用方法可用于解决广泛的科学和技术应用。论文链接:https://www.nature.com/articles/s43588-023-00581-5
现代科学方法采用通用方法,确保我们对自然的理解稳定而不冲突地进展:新理论需要根据先前积累的数据进行假设和检验,与基本科学原理兼容并可以通过实验验证。不幸的是,没有通用的算法 recipe 可以在复杂的系统中这样做以促进发现。因此,到目前为止,只有最基本的物理现象(通常是静态的、处于平衡状态)可以通过一组直观的方程来描述。许多动态的、非平衡的现象决定了生物学、软凝聚态物质和化学的功能,都是通过非常近似的经验定律来描述。人工智能和机器学习的进步为应对这一挑战提供了数据驱动解决方案的可能性。昂萨格倒易关系,是描述不可逆热力学过程的线性唯象定律中各系数间的倒易关系。它是粒子微观运动方程的时间反演不变性在宏观尺度上的反映。这个关系是 1931 年由拉斯·昂萨格(Lars Onsager)建立。拉斯·昂萨格因为发现了这些倒易关系而获颁授 1968 年的诺贝尔化学奖。在此,研究人员开发了人工智能平台——随机 OnsagerNet(S-OnsagerNet),可以直接从微观轨迹的观察中发现任意随机耗散动力系统的可解释和封闭的热力学描述。从数据中理解和预测动态过程的行为主要有两种方法:非结构化和结构化。S-OnsagerNet 方法属于后一类。到目前为止,还缺乏一种通用的结构化方法来模拟软物质、生物物理学和其他应用中经常出现的耗散、非平衡和噪声动力学。研究人员基于经典的 Onsager 原理,专门针对这类问题。物理系统的宏观热力学描述因其提供的见解而受到高度追捧。然而,对于一般的复杂动力系统来说,构建直观的热力学描述以进行后续的分析和控制是一项艰巨的任务。S-OnsagerNet 方法解决了这一挑战。对于给定的微观动力学,通过同时构建低维闭合坐标(确保部分可解释)以及这些坐标上的时间演化定律来学习宏观热力学描述。与一般的人工智能方法不同,该平台本质上限制了对物理相关进化定律的搜索。特别是,研究人员通过基于广义 Onsager 原理构建神经网络架构来确保与现有科学知识的兼容性。研究人员通过学习包含高达 900 个自由度的聚合物链的拉伸动力学,将其压缩为仅涉及三个宏观坐标的热力学描述来证明其方法,这些宏观坐标在计算和实验数据中控制聚合物拉伸动力学。图示:模拟设置、数据可视化、预测与真实拉伸轨迹及其统计数据。(来源:论文)
研究构建了宏观演化的能量图景,揭示了稳定态和过渡态的存在。这可以被视为动态状态方程。掌握这样的方程可以设计验证计算实验,包括热力学坐标的解释和聚合物拉伸速率的控制。图示:学习到的势能景观。(来源:论文)
研究人员将其进一步扩展到进行单分子 DNA 拉伸实验,并表明其热力学描述可用于区分快速和缓慢拉伸聚合物,远远超出目前的人类标记能力。此外,从自由能景观中得出的预测波动相关性与实验数据一致。图示:实验数据分析。(来源:论文)
为了进一步证明普遍适用性,研究人员应用 S-OnsagerNet 来推导空间流行病的宏观动态。图示:数据可视化和预测结果。(来源:论文)
该研究所提方法的潜在适用性超出了聚合物和流行病动力学,包括一般复杂的耗散过程,例如蛋白质折叠、自组装和玻璃系统。未来还有许多值得研究的方向来进一步提高所提出方法的稳健性和通用性。人们可以应用该方法来学习其他具有科学意义的系统的宏观热力学。