Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

谷歌推出 Caravan MultiMet,利用各种气象数据增强水文预报

图片

编辑 | KX

大样本水文学致力于解决紧迫的全球挑战,例如气候变化、洪水预测和水资源管理。通过利用不同地区的大量水文和气象信息数据集,研究人员开发了预测与水有关的现象的模型。这有助于保护社区和生态系统免受与水有关的挑战。

水文研究的一个重大问题是,支持实时预报和运营基准测试的数据集有限。ERA5-Land 等传统数据集虽然全面,但仅限于历史数据,限制了它们在实时预报中的应用。

Caravan 大样本水文数据集的创建是为了标准化和协调来自各个区域数据集的流量数据,并结合全球可用的气象强迫和集水区属性。

近日,来自 Google Research 的研究人员为 Caravan 提供了一个新颖的扩展,重点是丰富气象强迫数据。研究推出的 Caravan MultiMet 扩展,大大增强了现有的 Caravan 数据集。此扩展集成了六种新的气象产品,包括三种即时预报(CPC、IMERG v07 Early 和 CHIRPS)和三种天气预报(ECMWF IFS HRES、GraphCast 和 CHIRPS-GEFS)。

这些新增功能使研究人员能够在实时环境中全面分析水文模型。通过整合天气预报数据,该扩展弥合了事后预报和 operational 预报之间的鸿沟,使 Caravan 成为第一个包含如此多样化预报数据的大样本水文数据集。

相关研究以「Caravan MultiMet: Extending Caravan with Multiple Weather Nowcasts and Forecasts」为题,发表在预印平台 arXiv 上。

图片

论文链接:https://arxiv.org/abs/2411.09459v1

现有的水文工具(如 CAMELS 和 ERA5-Land)提供了宝贵的模型开发和评估见解。CAMELS 数据集覆盖美国、澳大利亚和欧洲等地区,标准化了各个集水区的数据并支持区域水文研究。ERA5-Land 具有全球覆盖范围和高质量表面变量,在水文学中得到广泛应用。

然而,这些数据集依赖于历史观测,需要与实时预报数据进行更多整合。这一限制使研究人员无法充分解决与水有关的现象的动态性质并有效应对实时场景。

图片

图 1:Caravan MultiMet 扩展所覆盖的 Caravan 仪表的位置。(来源:论文)

Caravan MultiMet 扩展包括以每日分辨率汇总的气象数据,涵盖 48 个国家/地区的 22,000 多个仪表。即时预报和预报产品的集成确保了跨数据集的兼容性。例如,扩展中的 ERA5-Land 数据在 UTC 区域中重新计算以与其他产品保持一致,从而简化了比较。预报数据(例如 CHIRPS-GEFS)提供的每日预报时间从 1 天到 16 天不等,而 DeepMind 开发的 GraphCast 采用图神经网络生成预报时间为 10 天的全球天气预报。

该扩展的 zarr 文件格式增强了可用性,使研究人员无需处理整个数据集即可高效查询特定变量、盆地和时期。此外,包括多种空间分辨率(例如 CHIRPS 的 0.05° 高分辨率)在内,进一步增强了数据集对于局部研究的稳健性。

图片

Caravan 中包含的预测数据显著提高了模型性能和评估能力。测试表明,温度、降水量和风分量等变量与 ERA5-Land 数据高度一致,在某些情况下 R² 得分高达 0.99。例如,与 ERA5-Land 相比,GraphCast 的总降水量数据显示 R² 为 0.87,凸显了其在水文应用中的可靠性。同样,ECMWF IFS HRES 数据显示出与 ERA5-Land 变量的兼容性,使其成为数据集的宝贵补充。这些结果强调了 MultiMet 扩展在提高水文模型准确性和适用性方面的有效性。

通过引入 Caravan MultiMet 扩展,来自 Google Research 的研究人员解决了水文数据集中的关键限制。集成各种气象产品有助于实时预报、强大的模型基准测试和提高预测准确性。这一进步代表了水文研究的重大进步,使更好的水资源管理和灾害缓解决策成为可能。该数据集在开放许可下的可用性进一步确保了其可访问性和对全球研究界的影响力。

数据开源地址:https://zenodo.org/records/14161235、https://zenodo.org/records/14161281
参考内容:https://www.marktechpost.com/2024/11/20/google-ai-research-introduces-caravan-multimet-a-novel-extension-to-caravan-for-enhancing-hydrological-forecasting-with-diverse-meteorological-data/
产业
相关数据
DeepMind机构

DeepMind是一家英国的人工智能公司。公司创建于2010年,最初名称是DeepMind科技(DeepMind Technologies Limited),在2014年被谷歌收购。在2010年由杰米斯·哈萨比斯,谢恩·列格和穆斯塔法·苏莱曼成立创业公司。继AlphaGo之后,Google DeepMind首席执行官杰米斯·哈萨比斯表示将研究用人工智能与人类玩其他游戏,例如即时战略游戏《星际争霸II》(StarCraft II)。深度AI如果能直接使用在其他各种不同领域,除了未来能玩不同的游戏外,例如自动驾驶、投资顾问、音乐评论、甚至司法判决等等目前需要人脑才能处理的工作,基本上也可以直接使用相同的神经网上去学而习得与人类相同的思考力。

https://deepmind.com/
基准技术

一种简单的模型或启发法,用作比较模型效果时的参考点。基准有助于模型开发者针对特定问题量化最低预期效果。

查询技术

一般来说,查询是询问的一种形式。它在不同的学科里涵义有所不同。在信息检索领域,查询指的是数据库和信息系统对信息检索的精确要求

图神经网络技术

图网络即可以在社交网络或其它基于图形数据上运行的一般深度学习架构,它是一种基于图结构的广义神经网络。图网络一般是将底层图形作为计算图,并通过在整张图上传递、转换和聚合节点特征信息,从而学习神经网络基元以生成单节点嵌入向量。生成的节点嵌入向量可作为任何可微预测层的输入,并用于节点分类或预测节点之间的连接,完整的模型可以通过端到端的方式训练。

推荐文章
暂无评论
暂无评论~