Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

AI首次解决量子物理学难题,DeepMind精确计算量子激发态,登Science

图片

编辑 | KX

此前,Google DeepMind 研究人员开发的费米子神经网络 (FermiNet) 非常适合对大量电子的量子基态进行建模。

FermiNet 最初专注于分子的基态。但是,当分子和材料受到大量能量的刺激时,例如暴露在光或高温下,电子可能会被踢入更高的能量状态——激发态。

激发态在物理学和化学等领域都很重要;然而,从第一原理出发对激发态特性进行可扩展、准确且稳健的计算仍然面临重要的理论挑战。

现在,DeepMind  研究人员开发了一种计算激发态的新方法,它比以前的方法更强大、更通用。该方法可以应用于任何类型的数学模型,包括 FermiNet 和其他神经网络

所提出的方法对许多原子和分子实现了精确的激发态计算,远远优于现有的使用深度学习计算激发态特性的方法(尤其是在较大的系统上),并且可以应用于各种量子系统。

论文一作兼通讯作者 David Pfau 激动发文「这是深度学习首次准确解决量子物理学中一些最难的问题。希望朝着深度学习的通用量子模拟迈出新的一步。」

图片

相关研究以「Accurate computation of quantum excited states with neural networks」为题,登上 Science 

图片

论文链接:https://www.science.org/doi/abs/10.1126/science.adn0137

分子激发态

当分子和材料受到大量能量的刺激时,例如暴露在光或高温下,它们的电子就会被踢入一种临时的新结构,称为激发态。

分子在状态之间转换时吸收和释放的确切能量量为不同的分子和材料创建了独特的指纹。这影响了从太阳能电池板和 LED 到半导体和光催化剂等技术的性能。它们还在涉及光的生物过程中发挥着关键作用,包括光合作用和视觉。

然而,这种指纹极难建模,因为激发电子本质上是量子的,这意味着它们在分子中的位置永远不确定,只能用概率来表示。

FermiNet 可以在一系列具有各种不同定性正电子结合特性的原子和小分子中产生高度精确的、在某些情况下是最先进的基态能量。

然而 FermiNet 最初专注于分子的基态。但是,当分子和材料受到大量能量的刺激时,例如暴露在光或高温下,电子可能会被踢入更高的能量状态——激发态。

准确计算激发态的能量比计算基态能量要困难得多。即使是基态化学的黄金标准方法,如耦合簇,在激发态上也显示出数十倍的误差。虽然研究人员想将其在 FermiNet 上的工作扩展到激发态,但现有方法的效果不足以使神经网络与最先进的方法相媲美。

更强大、更通用的激发态计算新方法

DeepMind 提出了一种通过变分蒙特卡罗估计量子系统激发态的算法,该算法没有自由参数,也不需要对状态进行正交化,而是将问题转化为寻找扩展系统基态的问题。可以计算任意可观测量,包括非对角期望,例如跃迁偶极矩。

该方法特别适用于神经网络分析,通过将该方法与 FermiNet 和 Psiformer ansatz 相结合,可以准确地恢复一系列分子的激发能量和振荡器强度。

图片

图示:从锂到氖的第一行原子的激发态能量。NES-VMC 应用于 FermiNet 的结果。(来源:论文)

研究人员将神经网络 ansätze 的灵活性与数学洞察力相结合,使其能够将寻找系统激发态的问题转换为寻找扩展系统基态的问题,然后可以使用标准 VMC 来解决。这种方法称为自然激发态 VMC (NES-VMC)。

激发态的线性独立性是通过 ansatz 的函数形式自动施加的。每个激发态的能量和其他可观测量都是通过将单态 ansätze 上的汉密尔顿期望值矩阵对角化而得到的,这些可观测量可以累积而无需额外成本。

至关重要的是,这种方法没有可调整的自由参数,也不需要惩罚项来强制正交化。研究人员使用两种不同的神经网络架构(FermiNet 和 Psiformer)检验了这种方法的准确性。

从单个原子到苯

研究人员在从单个原子到苯大小的分子的基准系统上测试了其方法。验证了 NES-VMC 在第一行(first-row)原子上的准确性,与实验结果非常接近,并且在一系列小分子上,得到了与现有最佳理论估计相当的高精度能量和振荡器强度。

图片

图示:碳二聚体的激发态。(来源:论文)

在一种名为碳二聚体的小而复杂的分子上,实现了 4 meV 的平均绝对误差 (MAE),这比以前的黄金标准计算准确度高出五倍。

图片

图示:乙烯的激发态和圆锥交叉点。(来源:论文)

在乙烯的情况下,NES-VMC 正确描述了扭曲分子的圆锥交叉点,并且与高精度多参考组态相互作用 (MR-CI) 结果高度一致。

图片

图示:较大双激发系统的激发态。(来源:论文)

研究还考虑了五个具有低位双激发的具有挑战性的系统,包括多个苯级分子。在所有方法在垂直激发能量上具有良好一致性的系统中,Psiformer 在各个状态下都具有化学准确性,包括丁二烯,其中某些状态的排序也已存在数十年的争议。

对于四嗪和环戊二烯酮,几年前最先进的计算已知是不准确的,NES-VMC 结果与最近复杂的扩散蒙特卡罗 (DMC) 和完全活性空间三阶微扰理论 (CASPT3) 计算非常接近。

图片

图示:苯的激发态。(来源:论文)

最后,还研究了苯分子,其中 NES-VMC 与 Psiformer ansatz 相结合与其他方法(包括使用惩罚方法的神经网络 ansätze)相比,与理论最佳估计值具有更好的一致性。这既验证了所提方法的数学正确性,也表明神经网络可以在当前计算方法的极限下准确地表示分子的激发态。

未来如何应用于多体量子力学

NES-VMC 是一种无参数且数学上合理的激发态变分原理。将其与神经网络 ansätze 相结合,可以在广泛的基准问题中获得显著的准确性。

量子系统激发态的精确 VMC 方法开辟了许多可能性,并大大扩展了神经网络波函数的应用范围。

虽然该研究只考虑了分子系统的电子激发和神经网络 ansätze,但 NES-VMC 适用于任何量子汉密尔顿量和任何 ansatz,从而可以进行精确的计算研究,从而可以提高科学家对振动电子耦合、光学带隙、核物理和其他具有挑战性的问题的理解。

研究人员表示:「我们很期待,NES-VMC 和深度神经网络未来将如何应用于多体量子力学中最具挑战性的问题。」

参考内容:

https://x.com/pfau/status/1826681648597135464

https://deepmind.google/discover/blog/ferminet-quantum-physics-and-chemistry-from-first-principles/

https://www.imperial.ac.uk/news/255673/ai-tackles-most-difficult-challenges-quantum/

产业DeepMindAI量子物理
相关数据
DeepMind机构

DeepMind是一家英国的人工智能公司。公司创建于2010年,最初名称是DeepMind科技(DeepMind Technologies Limited),在2014年被谷歌收购。在2010年由杰米斯·哈萨比斯,谢恩·列格和穆斯塔法·苏莱曼成立创业公司。继AlphaGo之后,Google DeepMind首席执行官杰米斯·哈萨比斯表示将研究用人工智能与人类玩其他游戏,例如即时战略游戏《星际争霸II》(StarCraft II)。深度AI如果能直接使用在其他各种不同领域,除了未来能玩不同的游戏外,例如自动驾驶、投资顾问、音乐评论、甚至司法判决等等目前需要人脑才能处理的工作,基本上也可以直接使用相同的神经网上去学而习得与人类相同的思考力。

https://deepmind.com/
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

基准技术

一种简单的模型或启发法,用作比较模型效果时的参考点。基准有助于模型开发者针对特定问题量化最低预期效果。

参数技术

在数学和统计学裡,参数(英语:parameter)是使用通用变量来建立函数和变量之间关系(当这种关系很难用方程来阐述时)的一个数量。

神经网络技术

(人工)神经网络是一种起源于 20 世纪 50 年代的监督式机器学习模型,那时候研究者构想了「感知器(perceptron)」的想法。这一领域的研究者通常被称为「联结主义者(Connectionist)」,因为这种模型模拟了人脑的功能。神经网络模型通常是通过反向传播算法应用梯度下降训练的。目前神经网络有两大主要类型,它们都是前馈神经网络:卷积神经网络(CNN)和循环神经网络(RNN),其中 RNN 又包含长短期记忆(LSTM)、门控循环单元(GRU)等等。深度学习是一种主要应用于神经网络帮助其取得更好结果的技术。尽管神经网络主要用于监督学习,但也有一些为无监督学习设计的变体,比如自动编码器和生成对抗网络(GAN)。

深度神经网络技术

深度神经网络(DNN)是深度学习的一种框架,它是一种具备至少一个隐层的神经网络。与浅层神经网络类似,深度神经网络也能够为复杂非线性系统提供建模,但多出的层次为模型提供了更高的抽象层次,因而提高了模型的能力。

量子力学技术

量子力学(Quantum Mechanics),为物理学理论,是研究物质世界微观粒子运动规律的物理学分支,主要研究原子、分子、凝聚态物质,以及原子核和基本粒子的结构、性质的基础理论。

推荐文章
暂无评论
暂无评论~