WeatherBench：面向数据驱动天气预测的基准数据集

Feb, 2020

WeatherBench：面向数据驱动天气预测的基准数据集

WeatherBench: A benchmark dataset for data-driven weather forecasting

Stephan Rasp, Peter D. Dueben, Sebastian Scher, Jonathan A. Weyn, Soukayna Mouatadid...

TL;DR本研究提出一个基于 ERA5 档案的天气预报基准数据集，为了方便机器学习模型的使用进行了处理，并提出了简单明了的评估指标，旨在加速数据驱动的天气预报研究。

Abstract

data-driven approaches, most prominently deep learning, have become powerful tools for prediction in many domains. A natural question to ask is whether →

data-driven deep learning weather forecasting benchmark dataset evaluation metrics

发现论文，激发创造

WeatherBench 2：面向下一代数据驱动的全球天气模型的基准测试

WeatherBench 2 是由 Rasp et al. (2020) 提出的全球中程（1-14 天）天气预测基准的更新版本，旨在加速数据驱动的天气模型的进展。本文描述了评估框架的设计原则，并呈现了当前最先进的物理模型和数据驱动的天气模型的结果。评估指标基于在领先的操作性天气中心评估天气预报的已建立实践，我们定义一组引人注目的分数以提供模型性能的概览。此外，我们还讨论了当前评估设置的注意事项以及数据驱动天气预测未来面临的挑战。

Aug, 2023

WEATHER-5K：全球大型站点天气数据集用于综合时间序列预测基准

全球站点天气预测（GSWF）对航空、农业、能源和灾害准备等各个领域至关重要。最近深度学习的进展通过基于公共气象数据优化模型，显著提高了天气预测的准确性。然而，现有的 GSWF 优化和基准数据集仍存在重大限制，如规模小、时间覆盖有限和缺乏全面的变量。为了应对这些挑战，我们推出了 WEATHER-5K 数据集，它包含来自全球 5,672 个气象站点的全面数据收集，涵盖了 10 年的时间间隔为一小时。该数据集包含多个关键的天气要素，为预测提供了更可靠、可解释的资源。此外，我们的 WEATHER-5K 数据集可作为评估现有著名预测模型的基准，扩展到 GSWF 方法之外，支持未来的时间序列研究挑战和机会。数据集和基准实现已公开在：这个 https 网址。

Jun, 2024

应用图神经网络预测全球天气

使用图神经网络的数据驱动方法预测全球天气，通过学习当前 3D 大气状态的六小时步长以及多步连接，可以产生数天后的精准预报，测试表现优于以前的数据驱动方法，并且与 GFS 和 ECMWF 的物理模型的全分辨率相当可比。

Feb, 2022

统一长期时间序列预测基准

为了支持机器学习方法在预测时间序列数据方面的进展，我们提供了一个专门设计用于长期时间序列预测的全面数据集。我们将从不同的动态系统和真实记录中获取的一系列数据集进行了标准化，每个数据集都被分成了训练和测试轨迹，并设定了预定的回溯长度。通过对经典和先进的模型（即 LSTM，DeepAR，NLinear，N-Hits，PatchTST，和 LatentODE）进行广泛的基准分析，我们确定在不同场景中最有效的模型。我们的研究结果显示出这些模型之间有着有趣的性能比较，突显了模型效果与数据集有关的特性。值得注意的是，我们引入了一个定制的 latent NLinear 模型并且通过课程学习阶段提高了 DeepAR 的性能，它们在效果上始终优于其原始版本。

Sep, 2023

推进数据驱动的天气预报: ERA5 的滑动时间数据增强

该研究通过使用自适应傅立叶神经算子 (AFNO) 模型以及提出的时间滑动方法对 ECMWF 重新分析 v5 (ERA5) 数据集进行扩充，采用低分辨率数据开创性地改进了现有的气象预测方法，从而提高了大气状况预测的准确性，并证实了该模型反映当前气候趋势的能力和预测未来气候事件的潜力，为气候建模领域提供了更具可行性和包容性的路径。

Feb, 2024

气象和气候建模机器学习基准测试

ClimateLearn 是第一个大规模的开源项目，旨在将气象和气候模型与现代机器学习系统进行连接，它能够大大简化机器学习模型的训练和评估，并包括综合流程，实现深度学习模型和定量和定性评估。

Jul, 2023

用于运营的数据驱动气象预测模型集合的亚季节预测

我们提出了一个实用的多模式集成天气预报系统，该系统使用混合数据驱动的天气预测模型与欧洲中期天气预报中心（ECMWF）海洋模型相结合，在 4 周的前期预测全球天气，分辨率为 1 度。对于 2 米温度的预测，我们的集成模型相比于原始的 ECMWF 扩展范围集成模型，在平均性能上提高了 4-17％（根据预测提前期而定）。然而，在应用统计偏差修正之后，ECMWF 集成模型在 4 周时相比较好，优势约为 3％。对于其他地表参数，我们的集成模型与 ECMWF 集成模型的性能差距也在几个百分点以内。我们证明了使用基于数据驱动的天气预测模型的多模式集成方法可以实现接近最新技术水平的次季节到季节性天气预报。

Mar, 2024

DynaBench: 低分辨率数据学习动态系统的基准数据集

本文介绍了一个新的模拟基准数据集 DynaBench, 用于直接从稀疏散乱的数据中学习动力系统。该数据集着重于通过低分辨率、非结构化的测量预测动力学系统的演变，并评估了几个机器学习模型（包括传统的图神经网络和点云处理模型）。

Jun, 2023

PostRainBench：全面基准和新型降水预测模型

通过提出 PostRainBench 多变量 NWP 后处理基准，我们介绍了一种简单但有效的渠道注意增强多任务学习框架 CAMT，它能在极端降水条件下优于传统的数值天气预报方法，进而减轻极端天气事件的严重后果。

Oct, 2023

一种实用的用于人工智能天气模型的概率基准

天气模型的概率技能与延迟集合相比较，发现 GraphCast 和 Pangu 是领先的 AI 天气模型，在确定性评分方面前者优于后者，但在概率 CRPS 指标上两者得分相同。

Jan, 2024