用于八小时降水预报的神经天气模型

高精度地预测未来数分钟到数周的天气是一项基本的科学挑战,会对社会的方方面面产生广泛影响。许多气象机构目前采用的预报都是基于大气的物理模型,尽管这些模型在过去几十年中得到了很大的改进,但本质上受到计算要求的限制,并且对支配它们的物理定律的近似值很敏感。一种能够克服其中一些限制的天气预报替代方法是使用深度神经网络(DNN):DNN 不是对显式的物理定律进行编码,而是发现数据中的模式,并使用 GPU 和TPU等强大的专用硬件上的并行计算来学习从输入到所需输出的复杂转换。

基于我们之前对降水临近预报的研究,我们提出了“ MetNet:一种用于降水预报的神经天气模型”,这是一种 DNN,能够以 1 公里的分辨率、2 分钟的间隔、最长 8 小时的时间尺度预测未来降水量。 MetNet 的表现优于NOAA目前使用的最先进的基于物理的模型,其预测时间可提前 7-8 小时,并且只需几秒钟就能预测整个美国的天气,而之前则需要一小时。网络的输入自动来自雷达站和卫星网络,无需人工注释。模型输出是一个概率分布,我们用它来推断每个地理区域最可能的降水率及其相关的不确定性。下图提供了该网络对美国大陆的预测示例。

1730476540269.jpg

MetNet 模型预测与 NOAA 多雷达/多传感器系统 (MRMS) 测量的地面实况进行比较。MetNet 模型(顶部)显示 2 分钟到 480 分钟内预测的 1 毫米/小时降水概率,而 MRMS 数据(底部)显示在同一时间段内降水量至少为 1 毫米/小时的区域。

神经天气模型

MetNet 不依赖于描述大气动力学的明确物理定律,而是通过反向传播学习,直接从观测数据预测天气。该网络使用由多雷达/多传感器系统(MRMS) 组成的地面雷达站得出的降水估计值和 NOAA 的地球静止环境作业卫星系统 的测量值,该系统提供大气中云层的自上而下的视图。这两个数据源都覆盖了美国大陆,并提供可由网络有效处理的图像式输入。

该模型以 1 公里的分辨率针对覆盖整个美国的每 64 公里 x 64 公里的正方形执行一次。但是,与每个输出区域相对应的输入数据的实际物理覆盖范围要大得多,因为它必须考虑在进行预测的时间段内云层和降水场的可能运动。例如,假设云层移动速度高达 60 公里/小时,为了做出明智的预测,捕捉未来 8 小时内大气的时间动态,该模型需要 60 x 8 = 480 公里的各个方向的空间背景。因此,要达到这一级别的背景,需要来自 1024 公里 x 1024 公里区域的信息,才能对中心 64 公里 x 64 公里区域进行预测。

1730476529683.jpg

包含卫星和雷达图像的输入补丁的大小(大,1024 x 1024 平方公里)和输出预测雷达图像的大小(小,64 x 64 平方公里)。

由于以全分辨率处理 1024 km x 1024 km 的区域需要大量内存,因此我们使用空间降采样器,通过减少输入块的空间维度来减少内存消耗,同时还可以查找并保留输入中的相关天气模式。然后,沿降采样输入数据的时间维度应用时间编码器(使用特别适合图像序列的卷积 LSTM实现),以 15 分钟为一个片段,对前 90 分钟输入数据的七个快照进行编码。然后,时间编码器的输出被传递到空间聚合器,该聚合器使用轴向自注意力来有效捕获数据中的长距离空间依赖性,并根据输入目标时间使用可变数量的上下文,以对 64 km x 64 km 的输出进行预测。

该架构的输出是一个离散概率分布,估计美国大陆每平方公里给定降水率的概率。

1730476518099.jpg

神经天气模型 MetNet 的架构。输入的卫星和雷达图像首先经过空间下采样器以减少内存消耗。然后,它们在 90 分钟的输入数据中以 15 分钟的间隔由卷积 LSTM 进行处理。然后使用轴向注意层使网络看到整个输入图像。

结果

我们根据降水率预报基准对 MetNet 进行了评估,并将结果与两个基线进行了比较——NOAA高分辨率快速刷新(HRRR) 系统,这是目前在美国运行的物理天气预报模型,以及估计降水场运动的基线模型(即光流),已知该方法在预测时间少于 2 小时时效果良好。

我们的神经天气模型的一个显着优势是它针对密集和并行计算进行了优化,非常适合在专用硬件(例如TPU)上运行。这允许在几秒钟内并行进行预测,无论是针对纽约市等特定位置还是整个美国,而 HRRR 等物理模型在超级计算机上的运行时间约为一小时。

我们在下图中量化了 MetNet、HRRR 和光流基线模型之间的性能差异。在这里,我们展示了这三个模型所实现的性能,使用F1 分数在降水率阈值 1.0 mm/h(相当于小雨)下进行评估。 MetNet 神经天气模型能够在少于 8 小时的时间范围内超越 NOAA HRRR 系统,并且始终优于基于流的模型。

1730476506445.jpg

以 1.0 mm/h 降水率的 F1 分数来评估性能(越高越好)。神经天气模型 (MetNet) 的表现优于目前在美国运行的基于物理的模型 (HRRR),其预测时间可达 8 小时。

由于大气的随机性,随着预测时间的延长,未来天气状况的不确定性也会增加。由于 MetNet 是一个概率模型,因此在可视化中可以看到预测的不确定性,即随着预测时间的延长,预测的平滑度会越来越高。相比之下,HRRR 并不直接进行概率预测,而是预测单一的潜在未来。下图比较了 MetNet 模型和 HRRR 模型的输出。

1730476490295.jpg

MetNet(顶部)和 HRRR(底部)的输出与 NOAA MRMS 系统检索到的地面实况(中间)之间的比较。请注意,虽然 HRRR 模型预测的结构看起来与地面实况更相似,但预测的结构可能非常不正确。

HRRR 物理模型的预测看起来比 MetNet 模型的预测更清晰、更有条理,但由于初始条件和模型参数的不确定性,结构(特别是预测结构的确切时间和位置)不太准确。

1730476476514.jpg

HRRR(左)从众多可能的结果中预测一个潜在的未来结果(红色),而 MetNet(右)通过分配未来结果的概率直接考虑不确定性。

未来方向

我们正在积极研究如何改进全球天气预报,特别是在受快速气候变化影响最深远的地区。虽然我们针对美国大陆展示了当前的 MetNet 模型,但它可以扩展到任何有足够雷达和光学卫星数据的地区。这里介绍的工作是这项工作的一小块垫脚石,我们希望通过未来与气象界的合作,可以取得更大的进步。

致谢

该项目是与 Lasse Espeholt、Jonathan Heek、Mostafa Dehghani、Avital Oliver、Tim Salimans、Shreya Agrawal 和 Jason Hickey 合作完成的。我们还要感谢 Manoj Kumar、Wendy Shang、Dick Weissenborn、Cenk Gazen、John Burge、Stephen Hoyer、Lak Lakshmanan、Rob Carver、Carla Bromberg 和 Aaron Bell 的有益讨论,以及 Tom Small 对可视化的帮助。

版权声明

本文仅代表作者观点,不代表本站立场。
本文系作者授权发表,未经许可,不得转载。

评论