Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

速度提高1000万倍,AI快速准确预测等离子体加热,助力核聚变研究

图片

编辑 | 白菜叶

用于等离子体加热的新型人工智能(AI)模型所能做的事情超出了人们之前的想象,不仅可以在保持准确性的情况下将预测速度提高 1000 万倍,而且还可以在原始数值代码失效的情况下正确预测等离子体加热。

「凭借我们的智能,我们可以训练人工智能超越现有数值模型的限制。」美国能源部 (DOE) 普林斯顿等离子体物理实验室 (PPPL) 的副研究员、物理学家 Álvaro Sánchez-Villar 说道。

Sánchez-Villar 的团队开发了 NSTX 和 WEST 上的实时核心离子回旋加速器频率范围 (ICRF) 加热模型。该模型基于两种非线性回归算法,即决策树的随机森林集成和多层感知器神经网络

该研究以「Real-time capable modeling of ICRF heating on NSTX and WEST via machine learning approaches」为题,于 2024 年 8 月 12 日发布在《Nuclear Fusion》。

图片

射频(RF)波加热系统是用来辅助加热磁约束聚变装置的重要方法之一,其中的离子回旋频率范围(ICRF)加热对托卡马克装置的运行效果和稳定性非常重要。

托卡马克中的等离子体变化通常需要用复杂的数学模型来计算,但这些模型太耗时,无法用于实时控制。

因此,科学家们开始使用机器学习技术开发快速的替代模型,这些模型是根据计算机代码生成的数据进行训练的,可以在保持精度的同时能大大缩短计算时间。虽然大部分数据与过去的结果一致,但在某些极端情况下,数据并不理想。

「我们观察到一种参数化状态,其中加热曲线在相当任意的位置出现不规则的尖峰。」Sánchez-Villar 说,「没有任何物理现象可以解释这些尖峰。」

Sánchez-Villar 识别并删除了训练集中有问题的数据(称为异常值),以训练他们的 AI,因为这些场景不符合物理规律。「我们通过消除训练数据集中的峰值来偏差我们的模型,但我们仍然能够预测物理现象。」Sánchez-Villar 说道。

图片

图示:氘的加热曲线如图 (d) 小幅、(e) 大幅和 (f) 临界异常情况所示。(来源:论文)

「正如所观察到的,代码正确地消除了尖峰,但预计突出显示的区域会产生更高的热量。然而,没有任何证据可以保证这些预测是物理的。」

然后,团队又向前迈进了一步。经过数月的研究,Sánchez-Villar 发现并解决了问题,即数值模型的局限性。随后,他针对最初显示随机峰值的异常情况运行了修正版代码。

他不仅发现在所有有问题的情况下,解决方案都没有出现峰值,而且令他惊讶的是,即使在关键的异常场景中,这些解决方案也几乎与几个月前预测的机器学习模型中的解决方案相同。

「这意味着,实际上,我们的替代实施相当于修复原始代码,只是基于对数据的精心管理,」Sánchez-Villar 说。「与每一项技术一样,通过智能使用,人工智能不仅可以帮助我们更快地解决问题,而且比以前更好,并克服我们人类自身的限制。」

他的团队开发了 NSTX 和 WEST 上的实时核心 ICRF 加热模型。该模型基于两种非线性回归算法,即决策树的随机森林集成和多层感知器神经网络。这些算法是在 TORIC ICRF 光谱求解器模拟中训练的,该模拟假设了麦克斯韦等离子体,NSTX 和 WEST 中预期的平顶操作场景。

图片

图示:NSTX 和 WEST 数据库使用的平衡配置,分别对应于第 138,506 次和第 56,898 次拍摄。(来源:论文)

正如预期的那样,这些模型还缩短了 ICRF 加热的计算时间。这些时间从大约 60 秒缩短到 2 微秒,从而能够加快模拟速度,而不会明显影响准确性。这一改进将帮助科学家和工程师探索使核聚变成为实用电源的最佳方法。

论文链接:https://iopscience.iop.org/article/10.1088/1741-4326/ad645d

相关内容:https://phys.org/news/2024-10-ai-plasma-important-code-fusion.html

理论机器学习核聚变等离子AI
相关数据
机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

参数技术

在数学和统计学裡,参数(英语:parameter)是使用通用变量来建立函数和变量之间关系(当这种关系很难用方程来阐述时)的一个数量。

非线性回归技术

非线性回归是回归函数关于未知回归系数具有非线性结构的回归。常用的处理方法有回归函数的线性迭代法、分段回归法、迭代最小二乘法等。非线性回归分析的主要内容与线性回归分析相似。

数据库技术

数据库,简而言之可视为电子化的文件柜——存储电子文件的处所,用户可以对文件中的数据运行新增、截取、更新、删除等操作。 所谓“数据库”系以一定方式储存在一起、能予多个用户共享、具有尽可能小的冗余度、与应用程序彼此独立的数据集合。

神经网络技术

(人工)神经网络是一种起源于 20 世纪 50 年代的监督式机器学习模型,那时候研究者构想了「感知器(perceptron)」的想法。这一领域的研究者通常被称为「联结主义者(Connectionist)」,因为这种模型模拟了人脑的功能。神经网络模型通常是通过反向传播算法应用梯度下降训练的。目前神经网络有两大主要类型,它们都是前馈神经网络:卷积神经网络(CNN)和循环神经网络(RNN),其中 RNN 又包含长短期记忆(LSTM)、门控循环单元(GRU)等等。深度学习是一种主要应用于神经网络帮助其取得更好结果的技术。尽管神经网络主要用于监督学习,但也有一些为无监督学习设计的变体,比如自动编码器和生成对抗网络(GAN)。

随机森林技术

在机器学习中,随机森林是一个包含多个决策树的分类器,并且其输出的类别是由个别树输出的类别的众数而定。 Leo Breiman和Adele Cutler发展出推论出随机森林的算法。而"Random Forests"是他们的商标。这个术语是1995年由贝尔实验室的Tin Kam Ho所提出的随机决策森林(random decision forests)而来的。这个方法则是结合Breimans的"Bootstrap aggregating"想法和Ho的"random subspace method" 以建造决策树的集合。

推荐文章
暂无评论
暂无评论~