利用人工智能扩大全球获取可靠洪水预报的渠道

KUI(0C81{49N5__6CW9JT7Q.png

大规模全球洪水预报长期以来一直无法实现。在今天发表的《自然》杂志论文中,我们展示了人工智能的突破如何弥补这一差距,即使在以前缺乏数据的地区也能提供可靠的洪水预报。

洪水是最常见的自然灾害,每年造成全球约500 亿美元的经济损失。自 2000 年以来,洪水相关灾害的发生率增加了一倍多,部分原因是气候变化。近15 亿人(占世界人口的 19%)面临严重洪水事件的巨大风险。升级预警系统,让这些人能够及时获得准确信息,每年可以挽救数千人的生命。

考虑到可靠的洪水预报可能对全球人民的生活产生影响,我们于 2017 年启动了洪水预报工作。在这一多年的历程中,我们多年来不断推进研究,并建立了一个实时运行的洪水预报系统,该系统可在 Google 搜索、地图、Android 通知和Flood Hub上提供警报。然而,为了在全球范围内推广,特别是在无法获得准确本地数据的地方,我们需要在研究方面取得更多进展。

在《自然》杂志发表的《全球无观测流域极端洪水预测》中,我们展示了机器学习 (ML) 技术如何显著改善全球洪水预报,相对于目前洪水相关数据稀缺的国家的最先进的水平。借助这些基于人工智能的技术,我们将目前可用的全球即时预报的可靠性平均从零延长到五天,并改进了非洲和亚洲各地区的预报,使其与目前欧洲的预报相似。这些模型的评估是与欧洲中期天气预报中心 ( ECMWF ) 合作进行的。

这些技术还使Flood Hub能够提前最多七天提供实时河流预报,覆盖80 多个国家的河流。这些信息可供民众、社区、政府和国际组织采取预防性行动,帮助保护弱势群体。

视频预览图像

观看影片

谷歌的洪水预报

FloodHub 工具所采用的机器学习模型是多年研究的成果,是与学术界、政府、国际组织和非政府组织等多个合作伙伴合作完成的。

2018 年,我们在印度恒河-布拉马普特拉河流域启动了一个试点预警系统,假设机器学习可以帮助解决大规模可靠洪水预报这一难题。次年,通过结合洪水模型、实时水位测量、创建海拔地图和水文建模,该试点进一步扩大。

我们与学术机构(尤其是约翰肯塔基大学机器学习研究所)合作,探索了基于 ML 的水文模型,结果表明基于LSTM的模型可以比传统的概念和基于物理的水文模型产生更准确的模拟。这项研究改进了洪水预报,使我们的预报范围扩大到整个印度和孟加拉国。我们还与耶鲁大学的研究人员合作,测试了可增加洪水预警范围和影响力的技术干预措施。

我们的水文模型通过处理公开的天气数据(如降水量和物理流域信息)来预测河流洪水。此类模型必须根据各个河流的流量测量站的长数据记录进行校准。全球只有一小部分河流流域(盆地)配有流量计,这些测量仪价格昂贵,但却是提供相关数据的必需品,而对于缺乏这种基础设施的流域,水文模拟和预报很难提供预测。较低的国内生产总值(GDP) 与更易遭受洪水风险相关,并且一个国家的 GDP 与公开数据量呈反比。机器学习有助于解决这个问题,它允许使用一个模型在所有可用的河流数据上进行训练,并将其应用于没有可用数据的未测量流域。通过这种方式,模型可以在全球范围内进行训练,并可以对任何河流位置做出预测。

洪水预报-5

一个国家公开的径流数据量与该国 GDP 之间存在反比(对数-对数)相关性。径流数据来自全球径流数据中心。

我们的学术合作促成了 ML 研究,该研究开发了估计河流预报不确定性的方法,并展示了 ML 河流预报模型如何综合来自多个数据源的信息。他们证明了这些模型可以可靠地模拟极端事件,即使这些事件不是训练数据的一部分。为了促进开放科学,我们在 2023 年在《自然科学数据》中开源了一个社区驱动的大样本水文学数据集。

河流预报模型

国家和国际机构用于洪水预报和河流建模的大多数水文模型都是状态空间模型,这些模型仅依赖于每日输入(例如降水量、温度等)和系统的当前状态(例如土壤湿度、积雪等)。 LSTM 是状态空间模型的一种变体,其工作原理是定义一个代表单个时间步长的神经网络,其中输入数据(例如当前天气状况)经过处理以生成该时间步长的更新状态信息和输出值(流量)。 LSTM 按顺序应用以进行时间序列预测,从这个意义上讲,其行为类似于科学家通常概念化水文系统的方式。根据经验,我们发现LSTM在河流预报任务上表现良好。

洪水预报-4

LSTM 的示意图,LSTM 是一种按时间顺序运行的神经网络。可在此处找到易于理解的入门知识。

我们的河流预报模型使用两个连续应用的 LSTM:(1) “后报” LSTM 采集截至当前时间(或更确切地说,预报发布时间)的历史天气数据(动态后报特征);(2) “预报” LSTM 采集后报 LSTM 中的状态以及预报天气数据(动态预报特征)以进行未来预测。一年的历史天气数据被输入到后报 LSTM 中,七天的预报天气数据被输入到预报 LSTM 中。静态特征包括流域的地理和地球物理特征,这些特征被输入到后报和预报 LSTM 中,并允许模型学习不同类型的流域中的不同水文行为和响应。

预测 LSTM 的输出被输入到“头部”层,该层使用混合密度网络生成概率预测(即,预测流量概率分布的参数)。具体来说,该模型在每个预测时间步骤预测重尾概率密度函数混合(称为非对称拉普拉斯分布)的参数。结果是一个混合密度函数,称为可数非对称拉普拉斯混合(CMAL) 分布,它表示特定时间特定河流的体积流量的概率预测。

洪水预报-1

基于 LSTM 的河流预报模型架构。两个 LSTM 依次应用,一个用于提取历史天气数据,另一个用于提取预测天气数据。模型输出是每个预测时间步的流量概率分布参数。

输入和训练数据

该模型使用三种类型的公开数据输入,主要来自政府来源:

代表地理和地球物理变量的静态流域属性:来自HydroATLAS 项目,包括长期气候指数(降水量、温度、雪量)、土地覆盖和人为属性(例如,作为人类发展指标的夜间灯光指数)等数据。

历史气象时间序列数据:用于在预报发布时间前一年启动模型。数据来自NASA IMERG、NOAA CPC 全球统一的基于测量仪的每日降水分析和ECMWF ERA5-land 再分析。变量包括每日总降水量、气温、太阳和热辐射、降雪量和地表气压。

七天预测期内的预测气象时间序列:用作预测 LSTM 的输入。这些数据与上面列出的气象变量相同,来自ECMWF HRES 大气模型。

训练数据是1980 年至 2023 年期间全球径流数据中心的每日流量值。使用来自 5,680 个不同流域流量计(如下所示)的数据训练单一流量预测模型,以提高准确性。

洪水预报-3

5,680 个流量计的位置,为全球径流数据中心的河流预报模型提供训练数据。

改进当前最先进的技术

我们将我们的河流预报模型与当前最先进的全球洪水预报系统GloFAS 版本 4进行了比较。这些实验表明,机器学习可以更早地提供准确的警告,并针对更大、影响更大的事件提供警告。

下图显示了预测世界各地河流位置不同严重程度事件时的F1 分数分布,准确度为正负 1 天。F1 分数是精确度和召回率的平均值,事件严重程度通过重现期来衡量。例如,2 年重现期事件是预计平均每两年超过一次的流量。我们的模型在长达 4 天或 5 天的提前期内实现了可靠性分数,平均而言,这些分数与 GloFAS 即时预报(0 天提前期)的可靠性相似或更好。

洪水预报-2

2014-2023 年期间,全球 2,092 个流域 2 年重现期事件的F1 得分分布,来自 GloFAS(蓝色)和我们的模型(橙色),预测时间不同。平均而言,我们的模型在统计上与 GloFAS 即时预报(0 天预测时间)一样准确,最多可提前 5 天预测 2 年(显示)和 1 年、5 年和 10 年事件(未显示)。

此外(未显示),我们的模型在较大和罕见的极端事件中实现了准确度,其 5 年重现期事件的准确率和召回率得分与 GloFAS 在 1 年重现期事件中的准确率相似或更好。有关更多信息,请参阅论文。

展望未来

洪水预报计划是我们适应和恢复力工作的一部分,体现了 Google应对气候变化的承诺,同时帮助全球社区提高恢复力。我们相信,人工智能和机器学习将继续在推动气候行动的科学和研究方面发挥关键作用。

我们积极与多个国际援助组织(例如人道主义数据中心和红十字会)合作,提供切实可行的洪水预报。此外,我们正在与世界气象组织(WMO)合作,支持气候灾害预警系统,并开展一项研究,帮助了解人工智能如何帮助解决国家洪水预报机构面临的现实挑战。

虽然本文介绍的工作表明洪水预报取得了重大进展,但未来还需要进一步扩大洪水预报覆盖范围,以覆盖全球更多地区和其他类型的洪水相关事件和灾害,包括山洪和城市洪水。我们期待继续与学术和专家社区、地方政府和业界的合作伙伴合作,以实现这些目标。


版权声明

本文仅代表作者观点,不代表本站立场。
本文系作者授权发表,未经许可,不得转载。

评论