MetNet-2:12 小时降水预报的深度学习

1727419348246.jpg

深度学习已成功应用于一系列重要挑战,例如癌症预防和提高可及性。深度学习模型在天气预报中的应用与人们的日常生活息息相关,从帮助人们规划一天的行程到管理食品生产、运输系统或能源网。天气预报通常依赖于由世界上最大的超级计算机驱动的传统物理技术。此类方法受到高计算要求的限制,并且对其所基于的物理定律的近似值很敏感。

深度学习为计算预测提供了一种新方法。深度学习模型不是采用明确的物理定律,而是直接从观察到的数据中学习预测天气模式,并且能够比基于物理的技术更快地计算预测结果。这些方法还有可能提高预测的频率、范围和准确性。

通过 MetNet-2 进行计算的说明。随着计算的进行,网络会处理来自输入的越来越大的背景,并对未来可能的天气状况做出概率预测。

在天气预报中,深度学习技术在即时预报方面显示出特别的前景——即预测未来 2-6 小时的天气。之前的研究主要集中在使用直接神经网络模型来处理天气数据,使用MetNet 架构将神经预报从 0 小时延长到 8 小时,生成未来 90 分钟的雷达数据连续性,以及解释这些神经网络学习到的天气信息。不过,深度学习仍有机会将改进扩展到更长期的预报。

为此,在“使用大型上下文神经网络进行 12 小时降水预测”中,我们将神经降水模型的预测范围扩大到 12 小时预测,同时保持 1 公里的空间分辨率和 2 分钟的时间分辨率。通过将输入上下文增加四倍,采用更丰富的天气输入状态,并扩展架构以捕获更长距离的空间依赖性,MetNet-2 大大提高了其前身 MetNet 的性能。与基于物理的模型相比,MetNet-2在长达 12 小时的天气预报方面 优于最先进的HREF 集成模型。

MetNet-2 的功能和架构

MetNet-2 等神经天气模型将地球观测结果映射到天气事件的概率,例如下午城市下雨的可能性、阵风达到 20 节的可能性或未来晴天的可能性。端到端深度学习可以通过直接连接系统的输入和输出来简化流程并提高质量。考虑到这一点,MetNet-2 旨在最大限度地降低创建预测所涉及的复杂性和总步骤数。

MetNet-2 的输入包括雷达和卫星图像,它们也用于 MetNet。为了更全面地捕捉大气快照,包括温度、湿度和风向等信息(这对于长达 12 小时的长期预报至关重要),MetNet-2 还使用物理模型中使用的预处理起始状态作为这些额外天气信息的代理。基于雷达的降水测量值 ( MRMS ) 是我们在训练中用来优化 MetNet-2 参数的基本事实(即我们试图预测的内容)。

示例地面真实图像:基于雷达(MRMS)捕获 12 小时过程的瞬时降水量(毫米/小时)。

MetNet-2 的概率预报可以看作是对所有可能的未来天气状况进行平均,并根据其发生的可能性进行加权。由于其概率性质,MetNet-2 可以比作基于物理的集成模型,该模型对各种基于物理的模型预测的一定数量的未来天气状况进行平均。这两种方法之间的一个显着区别是计算核心部分的持续时间:集成模型需要约 1 小时,而 MetNet-2 需要约 1 秒。

MetNet-2 预测和基于物理的集成中的步骤。

要进行 12 小时的预报,MetNet-2 必须克服的主要挑战之一是在输入图像中捕获足够多的空间上下文。对于每个额外的预报小时,我们在输入中包含每个方向的 64 公里的上下文。这会导致输入上下文的大小为 2048 2公里2 — 是 MetNet 中使用的大小的四倍。为了处理如此大的背景信息,MetNet-2 采用了模型并行,即将模型分布在Cloud TPU v3-128的 128 个核心上。由于输入上下文的大小,MetNet-2 用计算效率更高的卷积层取代了 MetNet 的注意力层。但标准卷积层具有局部感受野,可能无法捕获大的空间上下文,因此 MetNet-2 使用扩张感受野(其大小一层接一层加倍),以连接输入中彼此相距较远的点。

MetNet-2 的输入空间上下文和目标区域的示例。

结果

由于MetNet -2 的预测是概率性的,因此模型的输出自然会与类似概率的集成或后处理模型的输出进行比较。HREF就是这样一种用于预测美国降水的先进集成模型,它每天两次汇总来自五个不同模型的十个预测。我们使用既定指标(例如连续排序概率得分)来评估预测,该指标可以捕获模型预测相对于地面真实观测值的概率误差大小。尽管没有执行任何基于物理的计算,但 MetNet-2 在未来 12 小时内的低降水和高降水水平预测中的表现都优于 HREF。

在美国大陆随机分布的大量测试补丁上汇总的 MetNet-2 与 HREF 的连续排序概率分数(CRPS;越低越好)。

解释 MetNet-2 所获的天气信息

由于 MetNet-2 未使用手工制作的物理方程,因此其性能引发了一个自然的问题:在训练过程中,它从数据中学习到了什么样的天气物理关系?使用高级可解释性工具,我们进一步追踪了各种输入特征在不同预测时间线上对 MetNet-2 性能的影响。也许最令人惊讶的发现是,MetNet-2 似乎模拟了准地转理论所描述的物理现象,该理论被用作大规模天气现象的有效近似。MetNet-2 能够在典型的高压或低压系统(即天气尺度)的尺度上捕捉到大气力量的变化,这些变化带来了有利的降水条件,这是该理论的一个关键原则。

结论

MetNet-2 代表着朝着实现新的天气预报建模范式迈出了一步,这种范式不依赖于手动编码天气现象的物理原理,而是采用从观测到天气目标的端到端学习以及在低精度硬件上进行并行预报。然而,在完全实现这一目标的道路上仍存在许多挑战,包括直接整合更多有关大气的原始数据(而不是使用物理模型中经过预处理的起始状态)、扩大天气现象的范围、将预测时间范围延长至几天和几周,以及将地理覆盖范围扩大到美国以外。

致谢

Shreya Agrawal、Casper Sønderby、Manoj Kumar、Jonathan Heek、Carla Bromberg、Cenk Gazen、Jason Hickey、Aaron Bell、Marcin Andrychowicz、Amy McGovern、Rob Carver、Stephan Hoyer、Zack Ontiveros、Lak Lakshmanan、David McPeek、Ian Gonzalez、Claudio Martella、Samier Merchant、Fred Zyda、Daniel Furrer 和 Tom Small。

版权声明

本文仅代表作者观点,不代表本站立场。
本文系作者授权发表,未经许可,不得转载。

评论