机器学习大气模拟器中误差积累的定义
通过实时实验,本文量化了计算成本与预测误差之间的关系,使用气象业务为例,使用多个流行的回归技术对多个地点的温度、风速和云量进行了多个时段的短期预测,结果显示使用方差地平面方法能够降低计算使用量约 50%,同时导致 0-15% 的增加,而基于性能的重训练方法不仅能够降低计算使用量高达 90%,还提高了预测误差高达 10%,两者的组合在根据计算使用量归一化的误差方面优于其他模型配置达到 99.7%。
Sep, 2023
本研究提出一种基于卷积神经网络的机器学习方法,利用单个动力学模型集成来对表示预测误差协方差矩阵的状态相关预测不确定性进行估计,并在杂交数据同化方法中进行性能测试,证明该方法能够相对精确地预测高维状态中的预测协方差矩阵值。
May, 2023
本研究将机器学习和数据同化相结合,提出了一种迭代方法来纠正现有知识型模型的误差,为地球科学建立了一个混合替代模型,该模型在短期到中期范围内有更好的预测表现
Oct, 2020
本文选用六种模型(灰色预测模型、ARIMA 模型、SARIMAX 模型、人工神经网络模型、随机森林模型和长短时记忆模型)对中国所有部门(电力、工业、地面交通、住宅、国内航空、国际航空)在 2020 年 1 月 1 日至 2022 年 9 月 30 日的日期间序列数据进行预测,结果表明长短时记忆模型具有最佳的预测性能。
Feb, 2023
提出一种可追溯的错误特征化方法 (AEC),用于理解现有黑盒模型中的错误发生时间和位置,并能自动识别分类系统中的错误源。以情感分析任务为案例研究,结果表明 AEC 能将错误预测归纳为易懂的类别并在选择错误样本方面实现了可靠的结果。
May, 2021
该论文探讨了预测准确性测量中最广泛使用的均方误差绝对百分比(MAPE)存在的偏差,并提出了使用相对精度度量时的优越性,特别是在存在异方差性的数据中。该方法可避免 MAPE 的偏见,并可用于模型选择和参数拟合。
May, 2021
通过分布回归和集成学习方法,可以在空间预测和其他预测问题中利用零调整概率分布来创建由数据合并生成的降水数据集,并提供不确定性估计。通过与基准模型的比较,确定了层叠方法是最有效的策略,而在特定的分位数水平下,具体的层叠方法会有所不同,因此使用多个算法进行任务特定的组合可能会带来显著的好处。
Jun, 2024
混合物理机器学习气候模拟的研究表明,在线模型性能在内存融合、相对湿度输入特征转化和附加输入变量等方面得到改善,而在线误差的显著变化和离线与在线错误统计的不一致性表明应对数百种候选的机器学习模型进行在线评估来检测参数化设计选择的影响。
Sep, 2023