借助机器学习,DeepMind 又在降雨预测领域「祭出了大招」。
众所周知,英国人非常喜欢谈论天气。一个重要的原因是因为英国的天气比较多变,外出通常需要备伞。国内今年夏天也雨水颇多,降雨成为影响人们决策的重要因素。身处英国的顶级 AI 研究机构 DeepMind 近日与气象机构合作撰写并在《nature》上发表了一篇关于天气预测的论文,指出人工智能有望在不断变化的环境中帮助人们应对决策挑战。论文地址:https://www.nature.com/articles/s41586-021-03854-z纵观人类社会生活,天气预报具有悠久的历史。早在东汉时期,张衡就发明了世界最早的风向仪——相风铜鸟。南宋数学家秦九韶更提出了传统的雨量测试换算公式。到了明朝永乐年间,中国的雨量器已经发展成一套成熟的工具。而在现代生活中人们通常借助强大的数值天气预报 (NWP) 系统来预测天气。在数值天气预报(numerical weather prediction, NWP)中,通过求解物理方程可提前几天提供基本的行星尺度预测,但是却很难生成短期(例如两小时内)的高分辨率预测。因此就需要即时预报(Nowcasting)来填补性能差距。即时预报对于水资源管理、农业、航空、应急计划和户外活动等领域至关重要。天气传感方面的进步使得高频使用高分辨率雷达数据(测量地面降水量)成为现实。然而现有方法难以让高质量数据得到最佳利用,因此该研究提出用机器学习改进即时预报。DeepMind 此次的研究专注于降雨即时预报:最多提前 2 小时预测到降雨量、降雨时间和降雨地点。他们使用一种类似于 GAN 的深度生成模型方法 DGMR,并基于过去的雷达数据对未来的天气信息进行详细和合理的预测。该模型在大规模降雨事件语料库上进行训练,并且该研究还使用一种重要性采样方案(importance-sampling scheme)来创建一个更能代表强降雨的数据集。在整个过程中,所有模型都在 2016 至 2018 年英国的雷达观测数据上进行训练,并在 2019 年的测试集上进行了评估。经过训练后,该模型能够快速生成全分辨率即时预报:仅用一块英伟达 V100 GPU 就能在一秒左右的时间里生成单个预测。基于过去 20 分钟观测雷达获取的数据,DGMR 能够预测未来 90 分钟的降雨概率。从原理上来讲,DGMR 即时预报算法是一个条件式生成模型,它基于给定的时间点 T 使用基于雷达的地面降雨估计值 X_T,基于过去 M 个雷达场预测未来的雷达场。该模型包含潜在随机向量 Z 和参数θ,可以使用方程(1)表示:如下 DGMR 模型架构示意图展示了具有空间潜变量 Z 的雷达生成器(generator):下图 a 是雷达生成器的架构图;图 b(左)从上到下依次为时间判别器、空间判别器和潜在条件堆栈,b(右)从上到下依次为 G 块、D 和 3D 块、L 块。从概念上讲,这是一个生成雷达影像的问题。目前,研究团队利用这些方法,即可以准确地捕捉大规模降雨事件,也能够生成很多替代性降雨场景(被称为集合预报 ensemble prediction),从而探索降雨的不确定性。研究团队表示,他们特别感兴趣的是这些模型针对中到暴雨的降雨事件的预测能力,这些对人们生活和经济影响是较大的。因此,他们将 DGMR 与 PySTEPS 和 UNet 这两种同类方法进行了比较。为了公平起见,研究者隐匿了这些模型的名称,并邀请了英国国家气象局的 56 名气象专家进行认知评估。与其他两种方法相比,DGMR 在 1536×1280 公里的区域内实现了更真实、时空一致性更强的预测,并且 DGMR 更注重未来 5 到 90 分钟内的即时预测。研究者以两个实例进行了详细说明。首先是 2019 年 4 月英国遭遇的极强降雨事件(基于观测雷达的数据),如下动图所示,DGMR 相较平流方法 PySTEPS 能够更好地捕捉到环流、强度和结构,并且可以更准确地预测东北部的降雨量和运动。与确定性深度学习方法 UNet 相比,DGMR 生成的预测更加清晰。然后是 2019 年 4 月美国东部的强降雨事件(基于观测雷达的数据),如下动图所示,与 PySTEPS 相比,DGMR 能够平衡降雨的强度和范围,并且不像 UNet 那样预测结果模糊。研究者表示,与其他广泛使用的即时预报方法相比,56 名气象学家在 89% 的案例中将 DGMR 作为首选方案,证明了该方法能够为现实决策提供强大的支持。通过使用统计、经济和认知分析,DeepMind 的研究者展示了一种新的、具有竞争力的雷达降雨即时预测方法。未来研究者需要做更多的工作来提高长期预测的准确性以及对罕见和强烈事件的预测准确性。DeepMind 还将开发其他评估性能的方法,并进一步将这些方法专门用于特定的实际应用。研究者认为这是一个令人兴奋的研究领域,他们希望这篇论文能够作为新工作的基础,提供数据和验证方法,使提供有竞争力的验证和操作效用成为可能,并促进机器学习和环境科学的更大整合,以更好地支持应对气候变化的决策。https://deepmind.com/blog/article/nowcasting