使用 NeuralGCM 快速、准确地进行气候建模

@($PJ`ZU}{1L`H$KA[Y3AJ0.png

今天我们报告了 NeuralGCM,这是一个可以快速、高效、准确地模拟地球大气的模型。

虽然我们知道地球正以前所未有的速度变暖,但气温升高对我们的未来意味着什么尚不完全清楚。全球哪些地区将面临长期干旱?哪些地区的大型热带风暴会使沿海地区洪水泛滥更加频繁?随着气温升高,野火季节将如何变化?为了回答这些和其他相关问题,科学家需要能够准确预测地球气候。

今天,在《自然》杂志发表的《天气和气候的神经大气环流模型》中,我们介绍了一种基于机器学习 (ML) 的地球大气模拟新方法——NeuralGCM。NeuralGCM 是与欧洲中期天气预报中心(ECMWF) 合作开发的,它将传统的基于物理的建模与 ML 相结合,以提高模拟的准确性和效率。这种方法可以生成 2-15 天的天气预报,比目前基于物理的黄金标准模型更准确,并且比传统大气模型更准确地再现了过去 40 年的温度。虽然我们尚未将 NeuralGCM 构建成一个完整的气候模型,但它标志着朝着开发更强大、更易于访问的气候模型迈出了重要一步。我们希望它最终能够让我们更准确、更切实地了解气候变化的方式。

NeuralGCM 模拟了从 2019 年 12 月 26 日至 2020 年 1 月 8 日 14 天内的比湿模式。比湿值越高,颜色越浅。

利用 NeuralGCM 转变气候模型

尽管传统的气候模型几十年来一直在不断改进,但由于科学家对地球气候运作方式和模型建立方式的了解不完全,它们往往会产生错误和偏差。

这些模型将地球分成从地表一直延伸到大气层的立方体——通常每条水平边长 50-100 公里,然后预测一段时间内每个立方体中的天气情况。为了做出预测,他们根据完善的物理定律计算空气和水分的运动方式。但许多重要的气候过程,包括云和降水,其变化尺度(毫米到公里)比目前模型使用的立方体尺寸小得多,因此无法根据物理学进行计算。科学家还对某些过程缺乏完整的物理理解,例如云的形成。因此,这些传统模型不仅仅依赖第一原理,而是使用简化模型来生成近似值(称为参数化),以模拟小规模和不太理解的过程。这些简化的近似值本质上限制了基于物理的气候模型的准确性。

与传统模型一样,NeuralGCM 将地球大气层划分为立方体,并对空气和水分运动等大规模过程的物理特性进行计算。但它并不依赖科学家制定的参数化来模拟云层形成等小规模方面,而是使用神经网络从现有天气数据中学习这些事件的物理特性。

NeuralGCM 的一项关键创新是我们在JAX中从头重写了大规模过程的数值求解器。这使我们能够使用基于梯度的优化来“在线”调整耦合系统在许多时间步骤中的行为。相比之下,之前使用 ML 增强气候模型的尝试在数值稳定性方面遇到了很大困难,因为它们使用了“离线”训练,这忽略了随着时间的推移而积累的小规模和大规模过程之间的关键反馈。在 JAX 中编写整个模型的另一个好处是,它可以在 TPU 和 GPU 上高效运行,而传统的气候模型大多在CPU上运行。

NeuralGCM 将传统的流体动力学求解器与用于小规模物理的神经网络相结合。这些组件由微分方程求解器组合,使系统在时间上按顺序向前推进。

我们使用ECMWF 1979 年至 2019 年的天气数据(分辨率为 0.7°、1.4° 和 2.8°)训练了一套 NeuralGCM 模型。虽然我们的模型是根据天气预报进行训练的,但我们将 NeuralGCM 设计为通用大气模型。

准确的天气预报和气候预测

最近的地球大气 ML 模型(包括Google DeepMind 的 GraphCast)已证明天气预报具有突破性的准确性。迄今为止,ML 预测研究主要集中在短期预报上,远远低于气候预测所需的几年到几十年的预测时间。由于数十年的气候预测很难得到可靠的验证,我们使用已建立的WeatherBench 2基准对气候尺度预测的 NeuralGCM 进行了评估,并将其作为天气模型。

NeuralGCM 的确定性模型在 0.7° 分辨率下的性能可与当前最先进的模型相媲美,天气预报准确度可达 5 天。然而,确定性模型缺乏在较长时间内做出有用预测所需的量化不确定性。预报集合是根据略有不同的起始条件生成的,以产生一系列同样可能发生的天气情景。综合起来,这些集合会产生概率天气预报,这些预报通常比确定性预报更精确。

NeuralGCM 的 1.4° 分辨率集成模型在 5 到 15 天的预报准确率方面优于之前最先进的模型。性能提升是由于 NeuralGCM 能够生成与 ECMWF 最先进的基于物理的模型 ECMWF-ENS 相媲美的集成天气预报,而NeuralGCM 是第一个基于 ML 的模型。在 2 到 15 天的预报中,NeuralGCM 集成的准确率在 95% 的时间内优于 ECMWF-ENS。

NeuralGCM 在预测气候时间尺度方面的表现也优于最先进的大气模型。由于 NeuralGCM 仅对地球气候的大气成分进行建模,因此我们将其性能与基于物理的大气模型进行了比较。在预测 1980 年至 2020 年 40 年间的气温时,NeuralGCM 的 2.8° 确定性模型的平均误差是气候模型比对计划的大气模型( AMIP)的三分之一——0.25 摄氏度对 0.75 摄氏度。

比较 NeuralGCM 和 AMIP 在预测 1980 年至 2020 年期间 1000 hPa 全球平均气温方面的表现。全球平均气温 (C) 来自 ECMWF 再分析 v5 ERA5数据集。

由于传统大气模型难以模拟地球大气的某些方面,气候科学家有时会使用X-SHiELD等更高分辨率的模型,这些模型更准确,但计算成本更高。与 X-SHiELD 相比,NeuralGCM 的 1.4° 确定性模型在预测 2020 年的湿度和温度数据时误差减少了 15-50%,2020 年的数据是美国国家海洋和大气管理局(NOAA) 研究人员提供的一年的数据。在 2020 年的气候模拟中,NeuralGCM 还预测了与当年在同一地区观察到的风暴数量和强度相匹配的热带气旋模式。NeuralGCM 是第一个能够生成此类模式的基于 ML 的模型。

NeuralGCM 预测了 2020 年全球热带气旋的路径。预测的风暴与 ECMWF 再分析 v5(ERA5)数据集中显示的当年实际气旋的数量和强度相匹配。

开放、快速、高效的模式

NeuralGCM 的计算速度也比传统的基于物理的气候模型快几个数量级,计算成本也更低。我们的 1.4° 模型比 X-SHiELD 快 3,500 倍以上,这意味着如果研究人员使用 X-SHiELD 模拟一年的大气,需要 20 天,而使用 NeuralGCM 只需 8 分钟。虽然科学家只需要一台带有单个TPU的计算机即可运行 NeuralGCM,但他们需要请求访问具有 13,000 个CPU 的超级计算机才能运行 X-SHiELD。总体而言,使用 NeuralGCM 进行气候模拟的计算成本比使用 X-SHiELD 低 100,000 倍,速度的提升相当于高性能计算25 年的进步。

NeuralGCM 可以比最先进的物理模型更快地模拟大气,同时以相当的精度生成预测。此图比较了 NeuralGCM 和两个物理模型在 30 秒计算时间内生成的大气模拟天数。这三个模型以不同的分辨率运行,其中 X-SHiELD 分辨率最高(0.03°),NCAR CAM6 分辨率为 1.0°,NeuralGCM 分辨率最低(1.4°)。NOAA X-SHiELD 是一种高分辨率物理模型,必须在超级计算机上运行。NCAR CAM6 (AMIP) 是一种分辨率较低的大气专用物理模型,研究人员更常使用它,因为它的计算成本较低。尽管 NeuralGCM 以低分辨率运行,但其精度与高分辨率模型相当。

我们已将 NeuralGCM 的源代码和模型权重在 GitHub 上公开,供非商业使用。我们希望其他研究人员可以轻松添加新组件来测试假设并改进模型功能。此外,由于 NeuralGCM 可以在笔记本电脑上运行,而不需要超级计算机,我们希望更多的气候研究人员可以在他们的工作中使用这种最先进的模型。

结论和未来方向

NeuralGCM 目前仅模拟地球大气层。我们希望最终将地球气候系统的其他方面(例如海洋和碳循环)纳入模型。这样一来,我们将允许 NeuralGCM 进行更长时间尺度的预测,而不仅仅是预测几天和几周的天气,而是进行气候时间尺度的预测。

NeuralGCM 提出了一种构建气候模型的新方法,该方法比现有模型更快、计算成本更低、更准确。

致谢

我要感谢来自 Google、麻省理工学院和 ECMWF 的众多 NeuralGCM 论文贡献者,尤其是核心 NeuralGCM 团队(Dmitrii Kochkov、Janni Yuval、Ian Langmore、Peter Norgaard 和 Jamie Smith)。还要感谢 Michael Torrice、John Guilyard 和 Elise Kleeman 对这篇博文的帮助,以及 Lizzie Dorfman、Sameera Ponda、Michael Brenner 和 John Platt 的支持和领导。

版权声明

本文仅代表作者观点,不代表本站立场。
本文系作者授权发表,未经许可,不得转载。

评论