编辑 | KX
大样本水文学致力于解决紧迫的全球挑战,例如气候变化、洪水预测和水资源管理。通过利用不同地区的大量水文和气象信息数据集,研究人员开发了预测与水有关的现象的模型。这有助于保护社区和生态系统免受与水有关的挑战。
水文研究的一个重大问题是,支持实时预报和运营基准测试的数据集有限。ERA5-Land 等传统数据集虽然全面,但仅限于历史数据,限制了它们在实时预报中的应用。
Caravan 大样本水文数据集的创建是为了标准化和协调来自各个区域数据集的流量数据,并结合全球可用的气象强迫和集水区属性。
近日,来自 Google Research 的研究人员为 Caravan 提供了一个新颖的扩展,重点是丰富气象强迫数据。研究推出的 Caravan MultiMet 扩展,大大增强了现有的 Caravan 数据集。此扩展集成了六种新的气象产品,包括三种即时预报(CPC、IMERG v07 Early 和 CHIRPS)和三种天气预报(ECMWF IFS HRES、GraphCast 和 CHIRPS-GEFS)。
这些新增功能使研究人员能够在实时环境中全面分析水文模型。通过整合天气预报数据,该扩展弥合了事后预报和 operational 预报之间的鸿沟,使 Caravan 成为第一个包含如此多样化预报数据的大样本水文数据集。
相关研究以「Caravan MultiMet: Extending Caravan with Multiple Weather Nowcasts and Forecasts」为题,发表在预印平台 arXiv 上。
现有的水文工具(如 CAMELS 和 ERA5-Land)提供了宝贵的模型开发和评估见解。CAMELS 数据集覆盖美国、澳大利亚和欧洲等地区,标准化了各个集水区的数据并支持区域水文研究。ERA5-Land 具有全球覆盖范围和高质量表面变量,在水文学中得到广泛应用。
然而,这些数据集依赖于历史观测,需要与实时预报数据进行更多整合。这一限制使研究人员无法充分解决与水有关的现象的动态性质并有效应对实时场景。
Caravan MultiMet 扩展包括以每日分辨率汇总的气象数据,涵盖 48 个国家/地区的 22,000 多个仪表。即时预报和预报产品的集成确保了跨数据集的兼容性。例如,扩展中的 ERA5-Land 数据在 UTC 区域中重新计算以与其他产品保持一致,从而简化了比较。预报数据(例如 CHIRPS-GEFS)提供的每日预报时间从 1 天到 16 天不等,而 DeepMind 开发的 GraphCast 采用图神经网络生成预报时间为 10 天的全球天气预报。
该扩展的 zarr 文件格式增强了可用性,使研究人员无需处理整个数据集即可高效查询特定变量、盆地和时期。此外,包括多种空间分辨率(例如 CHIRPS 的 0.05° 高分辨率)在内,进一步增强了数据集对于局部研究的稳健性。
Caravan 中包含的预测数据显著提高了模型性能和评估能力。测试表明,温度、降水量和风分量等变量与 ERA5-Land 数据高度一致,在某些情况下 R² 得分高达 0.99。例如,与 ERA5-Land 相比,GraphCast 的总降水量数据显示 R² 为 0.87,凸显了其在水文应用中的可靠性。同样,ECMWF IFS HRES 数据显示出与 ERA5-Land 变量的兼容性,使其成为数据集的宝贵补充。这些结果强调了 MultiMet 扩展在提高水文模型准确性和适用性方面的有效性。
通过引入 Caravan MultiMet 扩展,来自 Google Research 的研究人员解决了水文数据集中的关键限制。集成各种气象产品有助于实时预报、强大的模型基准测试和提高预测准确性。这一进步代表了水文研究的重大进步,使更好的水资源管理和灾害缓解决策成为可能。该数据集在开放许可下的可用性进一步确保了其可访问性和对全球研究界的影响力。