机器学习大气模拟器中误差积累的定义

May, 2024

机器学习大气模拟器中误差积累的定义

Defining error accumulation in ML atmospheric simulators

Raghul Parthipan, Mohit Anand, Hannah M. Christensen, J. Scott Hosking, Damon J. Wischik

TL;DR该研究使用机器学习模型，提出了对大气系统中的误差积累进行定义和测量的方法，并通过提出的正则化损失函数想验证其有效性，从而在实际天气预测任务中取得了性能改进。

Abstract

machine learning (ML) has recently shown significant promise in modelling atmospheric systems, such as the weather. Many of these ML models are autoregressive, and →

machine learning atmospheric systems error accumulation regularization loss penalty weather prediction

发现论文，激发创造

机器学习时间序列预测中的计算效率和预测误差平衡：基于气象现在预报的实时实验洞察

通过实时实验，本文量化了计算成本与预测误差之间的关系，使用气象业务为例，使用多个流行的回归技术对多个地点的温度、风速和云量进行了多个时段的短期预测，结果显示使用方差地平面方法能够降低计算使用量约 50%，同时导致 0-15% 的增加，而基于性能的重训练方法不仅能够降低计算使用量高达 90%，还提高了预测误差高达 10%，两者的组合在根据计算使用量归一化的误差方面优于其他模型配置达到 99.7%。

Sep, 2023

在线机器学习用于顺序数据同化的预测不确定性估计

本研究提出一种基于卷积神经网络的机器学习方法，利用单个动力学模型集成来对表示预测误差协方差矩阵的状态相关预测不确定性进行估计，并在杂交数据同化方法中进行性能测试，证明该方法能够相对精确地预测高维状态中的预测协方差矩阵值。

May, 2023

运用机器学习技术纠正数据同化和预测应用中的模型误差

本研究将机器学习和数据同化相结合，提出了一种迭代方法来纠正现有知识型模型的误差，为地球科学建立了一个混合替代模型，该模型在短期到中期范围内有更好的预测表现

Oct, 2020

基于统计学和机器学习模型的实时日常排放比较研究

本文选用六种模型（灰色预测模型、ARIMA 模型、SARIMAX 模型、人工神经网络模型、随机森林模型和长短时记忆模型）对中国所有部门（电力、工业、地面交通、住宅、国内航空、国际航空）在 2020 年 1 月 1 日至 2022 年 9 月 30 日的日期间序列数据进行预测，结果表明长短时记忆模型具有最佳的预测性能。

Feb, 2023

时间序列预测模型复制过去：如何缓解

本文探讨神经网络中应用于时间序列预测的一些问题，提出了一种正则化方法，该方法能够缓解预测中所观测到的问题，并在合成和真实数据集上进行了评估。

Jul, 2022

ACE 指标：准确天气预报的平流和对流评估

数据驱动的天气预测方法中的评估指标存在问题，我们提出了适用于天气变量的 ACE 指标来解决这些问题。

Jun, 2024

可追溯的错误特征化

提出一种可追溯的错误特征化方法 (AEC)，用于理解现有黑盒模型中的错误发生时间和位置，并能自动识别分类系统中的错误源。以情感分析任务为案例研究，结果表明 AEC 能将错误预测归纳为易懂的类别并在选择错误样本方面实现了可靠的结果。

May, 2021

模型选择和模型估计中更好的相对预测准确度度量

该论文探讨了预测准确性测量中最广泛使用的均方误差绝对百分比（MAPE）存在的偏差，并提出了使用相对精度度量时的优越性，特别是在存在异方差性的数据中。该方法可避免 MAPE 的偏见，并可用于模型选择和参数拟合。

May, 2021

融合分布回归算法的卫星降水空间预测中的不确定性估计

通过分布回归和集成学习方法，可以在空间预测和其他预测问题中利用零调整概率分布来创建由数据合并生成的降水数据集，并提供不确定性估计。通过与基准模型的比较，确定了层叠方法是最有效的策略，而在特定的分位数水平下，具体的层叠方法会有所不同，因此使用多个算法进行任务特定的组合可能会带来显著的好处。

Jun, 2024

气候模型中机器学习参数化的系统抽样和验证

混合物理机器学习气候模拟的研究表明，在线模型性能在内存融合、相对湿度输入特征转化和附加输入变量等方面得到改善，而在线误差的显著变化和离线与在线错误统计的不一致性表明应对数百种候选的机器学习模型进行在线评估来检测参数化设计选择的影响。

Sep, 2023