Dish-TS:缓解时间序列预测中分布偏移的通用范式
本文提出了一种基于超网络的框架,称为超时间序列预测(HTSF),它在分布漂移下可以实现准确的时间序列预测,并通过实验验证在 9 个基准测试中达到了最先进的性能。
Feb, 2022
在没有任何先兆的情况下,本文旨在解决连续数据建模中突发分布转变的问题。具体而言,我们设计了一个名为 T-SaS 的贝叶斯框架,使用离散分布建模变量捕捉数据的突变。然后,我们设计了一个模型,通过学习判断在完整网络中应该激活哪些神经元来实现与该离散变量的动态网络选择进行自适应。通过一组稀疏网络的重叠,采用动态遮罩策略来支持不同分布之间的互相转移。大量实验证明我们的方法在准确检测分布转变边界以获取不同分布的片段并有效适应下游预测或分类任务方面优越。
Sep, 2023
我们通过综合当前时期和历史时期的数据集,研究模型评估和选择在变化环境中的情况。为了应对未知且可能随机的时间分布转移,我们开发了一种自适应滚动窗口方法来估计给定模型的泛化误差。该策略还通过估计两个候选模型的泛化误差差异来方便比较。我们进一步将两两比较整合到单一淘汰赛中,从候选模型集合中实现接近最优的模型选择。理论分析和数值实验证明了我们提出的方法对数据非稳定性的适应性。
Feb, 2024
在机器学习任务中,分布偏移是一种常见情况,其表示训练模型使用的数据与实际应用模型的数据不同。本文旨在定义和检测教育环境中的分布偏移,关注标准预测问题,即学习一个以输入序列为输入(预测变量)X=(x_1,x_2,...,x_m) 并生成输出 Y=f (X) 的模型。
May, 2024
本文介绍了机器学习领域中的分布漂移和时间漂移问题,通过时间戳元数据来增强模型学习能力,提出了一个包含五个数据集的基准测试,使用 13 种不同的方法进行系统评估,同时针对不同的实际应用场景设计了两种评估策略,发现现有的方法已经无法缩小在分布内和分布外数据间的性能差距。
Nov, 2022
本文提出自适应循环神经网络 (AdaRNN) 来解决时间序列的分布漂移问题,并通过两个新算法来建立自适应模型。AdaRNN 是一个通用的框架,它集成了灵活的分布距离。实验表明,AdaRNN 在人类活动识别、空气质量预测和金融分析方面的表现优于最新的方法,并且能够显著降低均方根误差 (RMSE) 并提高性能。
Aug, 2021
本文提出了一种新的时间序列预测方法,通过解决分布转移问题以及采用解耦的公式,并在联合学习变换和预测的基础上,利用 instance normalization flows 实现时间序列的转换。通过广泛实验验证,在合成和实际数据上,我们的方法始终优于现有基线算法。
Jan, 2024
本文提出了一种基于加权经验风险最小化的方法处理时间序列预测中的分布偏移问题,具有遗忘机制和基于梯度的学习方法,可提高优化效率和参数灵活性。
Jul, 2022
使用大型语言模型和数据源接口来探索和收集时间序列数据集的方法,扩大数据量以应对限制或缺乏关键属性的原始数据,有效补充现有数据集,尤其在数据分布变化方面。演示了通过实际示例证明了收集数据集的有效性,并展示了在这些数据集上进行微调的时间序列预测基础模型与未经微调的模型相比具有可比的性能。
Jun, 2024