Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

Nature|机器学习和物理模型的「双向奔赴」,3种AI气候建模方法

图片

编辑 | ScienceAI

气候科学家 Tapio Schneider 很高兴,因为机器学习让他摆脱了日常工作中繁琐乏味的任务。

十多年前,当他第一次开始模拟云的形成时,这主要涉及到煞费苦心地调整描述水滴、气流和温度如何相互作用的方程。但自 2017 年以来,机器学习人工智能 (AI) 改变了他的工作方式。

机器学习让这门科学变得更加有趣,」在加州理工学院工作的 Schneider 说。「它速度更快、更令人满意,而且你可以获得更好的解决方案。」

传统的气候模型是由 Schneider 等科学家从头开始手动构建的,他们使用数学方程来描述陆地、海洋和空气相互作用并影响气候的物理过程。这些模型运行良好,足以做出指导全球政策的气候预测。

但这些模型依赖于强大的超级计算机,需要数周的时间才能运行,并且是能源密集型的。Schneider 说,一个典型的模型需要消耗高达 10 兆瓦时的能量来模拟一个世纪的气候。平均而言,这大约相当于一个美国家庭每年的用电量。此外,此类模型很难模拟小规模过程,例如雨滴的形成方式,而雨滴通常在大规模天气和气候结果中发挥重要作用,Schneider 说。

图片

机器学习通过发现数据集中的模式来学习,已经在天气预报中显示出前景,现在正在介入帮助解决气候建模中的这些问题。

加州大学洛杉矶分校的计算机科学家 Aditya Grover 表示:「机器学习在气候预测方面的前景看起来非常有前景。」 他说,与早期的天气预报类似,出现了一系列创新,有望改变科学家模拟气候的方式。

但仍有一些障碍需要克服——包括让每个人相信基于机器学习的模型正在做出正确的预测。

Copy cats

研究人员主要通过三种方式使用人工智能进行气候建模。第一种方法是开发一种称为模拟器的机器学习模型,该模型可以产生与传统模型相同的结果,而无需进行所有数学计算。

将传统的气候模型视为一个计算机程序,它可以根据物理因素(例如球的投掷力度、投掷地点以及旋转速度)来计算球将在何处落地。模拟器可以被认为相当于一名体育运动员,他学习所有这些建模输出中的模式,然后能够预测球将落在哪里,而无需处理所有数学运算。

在 2023 年的一项研究中,澳大利亚联邦科学与工业研究组织(CSIRO)的气候科学家 Vassili Kitsios 和他的同事开发了 15 个机器学习模型,可以模拟 15 个基于物理的大气模型。

他们使用物理模型对截至 2100 年的地表气温的预测,针对两种大气碳浓度路径(低碳排放情景和高碳排放情景)训练了名为 QuickClim 的系统。Kitsios 表示,在笔记本电脑上训练每个模型大约需要 30 分钟。研究人员随后要求 QuickClim 模型预测中等碳排放情景下的温度,而模型在训练期间没有看到这种情况 结果与传统的基于物理的模型非常吻合。

图片

Kitsios 表示,一旦接受了所有三种排放情景的训练,QuickClim 就可以快速预测本世纪在许多碳排放情景下全球地表温度将如何变化——比传统模型快约一百万倍。「使用传统模型,您可以分析的碳浓度路径少于五个左右。QuickClim 现在允许我们完成数千条路径——因为它速度很快。」他说。

QuickClim 有一天可以通过探索多种场景来帮助政策制定者,而传统方法需要太长时间才能模拟。Kitsios 表示,QuickClim 等模型不会取代基于物理的模型,但可以与它们一起工作。

由华盛顿西雅图艾伦人工智能研究所的大气科学家 Christopher Bretherton 领导的另一组研究人员,为基于物理的大气模型开发了机器学习模拟器。在 2023 年的研究中,该团队首先通过将十组初始大气条件输入基于物理的模型,为该模型创建了一个名为 ACE 的训练数据集。对于每组数据,基于物理的模型都预测了包括气温、水蒸气和风速在内的 16 个变量在未来十年内将如何变化。

图片

论文链接:https://arxiv.org/abs/2310.02074

经过训练后,ACE 能够在长达 10 年的时间跨度内,迭代地使用 6 小时前的估计值来提前 6 小时进行预测。而且它表现良好:比基于物理的模型的精简版本更好,该模型以一半的分辨率运行,以节省时间和计算能力。在那次比较中,ACE 更准确地预测了 90% 的大气变量的状态,运行速度快了 100 倍,能源效率提高了 100 倍。

研究作者、艾伦人工智能研究所的气候科学家 Oliver Watt-Meyer 表示,他感到很惊讶。「结果让我印象深刻。这些早期发现表明,我们将能够制作出非常快速、准确并能够探测许多不同场景的模型。」他说。

坚实的「基础」

在第二种方法中,研究人员以更基本的方式使用人工智能,为气候模型提供动力。这些「基础」模型随后可以进行调整,以执行各种下游气候和天气相关任务。

Grover 说,基础模型的「基础」是这样的逻辑:数据中存在一些基本的、可能未知的模式,可以预测未来的气候。他认为,通过发现这些隐藏的模式,基础模型有望比传统方法做出更好的气候、天气预测。

在 2023 年的一篇论文中,Grover 和微软的研究人员一起构建了第一个此类基础模型,名为 ClimaX。它根据五个基于物理的气候模型的输出进行训练,这些模型模拟了 1850 年至 2015 年的全球天气和气候,包括气温、气压和湿度等因素,模拟时间尺度从几小时到几年不等。与模拟器模型不同,ClimaX 并未针对模仿现有气候模型的特定任务进行训练。

图片

论文链接:https://arxiv.org/abs/2301.10343

经过这次训练后,团队对 ClimaX 进行了微调,使其能够执行广泛的任务。其中,该模型根据二氧化碳、二氧化硫、黑碳和甲烷水平的输入变量预测了全球平均地表温度、每日温度范围和降雨量。

加州大学圣地亚哥分校的大气物理学家 Duncan Watson-Parris 团队 2022 年在一项研究中提出了比较人工智能气候模型的基准

图片

论文链接:https://agupubs.onlinelibrary.wiley.com/doi/10.1029/2021MS002954

ClimaX 比 Watson-Parris 团队构建的三个气候模拟器更好地预测了与温度相关的变量状态。但是,Grover 表示,ClimaX 在预测降雨量方面的表现,不如这三个模拟器中最好的模型。

「我喜欢基础模型的想法。」Watson-Parris 说,但他同样表示,这些早期发现尚未证明 ClimaX 可以超越传统的气候模型,或者说尚未证明基础模型本质上优于模拟器。

Schneider 认为,很难让人们相信任何机器学习模型都能胜过传统方法。他说,未来气候的真实状况尚不清楚,人们迫不及待地想看看这些模型的表现如何。根据过去的气候行为测试气候模型是有效的,但并不能完美地衡量它们如何预测可能与人类以前所见过的截然不同的未来。Schneider 表示,也许如果模型在季节性天气预报方面做得更好,那么它们在长期气候预测方面也会做得更好。「但据我所知,这还没有得到证实,也不能保证。」他说。

此外,很难解释许多人工智能模型的工作方式,这个问题被称为人工智能黑匣子,这可能会让人们难以信任它们。「对于气候预测,你绝对需要相信模型的推断能力。」Watson-Parris 说。

两全其美

Schneider 说,第三种方法是将机器学习组件嵌入基于物理的模型中以生成混合模型——这是一种妥协。

图片

传统的气候模型很难预测积雪,但融合了机器学习和基于物理的技术的混合模型已经成功模拟了积雪和其他小规模过程。

在这种情况下,机器学习模型将仅替代传统模型中效果表现较差的方面——通常是对小规模、复杂和重要过程的建模,例如云的形成、积雪和河流。Schneider 说,这些是标准气候模型中的一个「关键症结」。「我认为圣杯确实是使用人工智能工具来学习如何表示小规模流程。」他说。

他同时表示,这种混合模型可以比纯粹基于物理的模型表现得更好,同时比完全由人工智能构建的模型更值得信赖。

本着这种精神,Schneider 团队建立了地球大气层和陆地的物理模型,其中包含一些此类小规模过程的机器学习表示。他说,在根据历史观测进行河流流量和积雪预测的测试中,它们表现良好。

图片

论文链接:https://clima.caltech.edu/files/2023/04/Snow_Prediction_Paper.pdf

「我们发现机器学习模型在模拟某些现象方面,比物理模型更有效。」Schneider 说。Watson-Parris 同意这一观点。

到 2024 年年底,Schneider 团队希望完成一个可以与大气和陆地模型耦合的海洋混合模型,作为 Climate Modeling Alliance(CliMA)项目的一部分。

美国宇航局和欧盟委员会正在开展类似的研究,用于创建「数字孪生」地球。欧洲中期天气预报中心的 Florian Pappenberger 表示,这个名为「Destination Earth」(DestinE)的项目将于 2024 年 6 月进入第二阶段,其中机器学习技术将发挥关键作用。

Schneider 表示,最终目标是创建地球系统的数字模型,由人工智能提供支持,可以以闪电般的速度模拟天气和气候,精确度可达公里级。我们还没有达到这个目标,但研究人员表示这个目标现在就在眼前。

参考内容:https://www.nature.com/articles/d41586-024-00780-8

理论
相关数据
机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

基准技术

一种简单的模型或启发法,用作比较模型效果时的参考点。基准有助于模型开发者针对特定问题量化最低预期效果。

逻辑技术

人工智能领域用逻辑来理解智能推理问题;它可以提供用于分析编程语言的技术,也可用作分析、表征知识或编程的工具。目前人们常用的逻辑分支有命题逻辑(Propositional Logic )以及一阶逻辑(FOL)等谓词逻辑。

数字孪生技术

数字孪生(*Digital twin*)指可用于各种目的物理资产(物理孪生,physical twin)、过程、人员、场所、系统和设备的数字副本。

暂无评论
暂无评论~