研究了如何通过模型重用应对数据流中的概念漂移问题,为每个模型赋予权重,并根据模型性能自适应调整权重,在合成和真实数据集上进行实验验证方法的优越性。
Sep, 2018
在线更新时间序列预测模型针对概念漂移通过基于流数据调整预测模型来解决挑战。我们提出了一种新颖的方法 D3A,首先检测概念漂移,然后在检测到漂移后积极调整当前模型以适应漂移的概念,从而快速适应。通过在现有的训练样例中引入高斯噪声的数据增强策略,我们提出了一种最大程度利用历史数据进行模型适应的方法。我们的实证研究跨越六个数据集,证明了 D3A 在提高模型适应能力方面的有效性。与简单的时间卷积网络(TCN)基准相比,D3A 将均方误差(MSE)平均降低了 43.9%。对于最先进的模型,MSE 降低了 33.3%。
Mar, 2024
本研究提出了一种基于 DDG-DA 的预测建模方法,结合对数据演化的预测和生成的方法,能够有效应对概念漂移,提高预测性能。
Jan, 2022
提出了自适应物联网数据分析框架,在优化的 LightGBM 和概念漂移适应的基础上实现异常检测。通过实验验证,该框架具有高准确性和效率,并且不需要人类干预即可进行连续学习和漂移自适应。
Apr, 2021
概念漂移对机器学习模型产生不准确的影响,并且在流式数据背景下,多数研究假设连续的数据点之间是独立的。本研究发现时序依赖性对采样过程有很大影响,因此需要对现有定义进行重大修改,特别是平稳性的概念不适用于这种设置,而需要探讨替代方案。通过数值实验证明了这些替代形式的概念能够描述可观察的学习行为。
Dec, 2023
本文提出了一种基于权重调整的时间序列预测框架,通过降低由突发变化造成的损失和提升正常状态下的损失来提高预测精度。通过对 12 种模型在 8 种数据集上的实验,证明该方法能够平均降低 MSE 10.1%,在最先进的模型上可以高达 18.6%。
Feb, 2023
我们提出了一种基于平行坐标的新型可视化模型,通过连接连续时间窗口中分布的均值,将漂移显示为这些分布的变化,用于解释机器学习模型在选择漂移点时的决策,并能检测和描述概念漂移,为进一步研究开辟了可能性。
Jun, 2024
本文提供了四种文本漂移生成方法,以便生成带有标记漂移的数据集,并使用增量分类器测试它们恢复漂移的能力。结果表明,所有方法在漂移后性能都有所下降,增量支持向量机在准确性和宏 F1 得分方面运行速度最快,恢复了之前的性能水平。
本文提出了一种迭代式无监督自适应预测模型算法,用于解决由于数据来源非平稳性导致的渐进性概念漂移问题,并在合成数据和真实数据上做了大量数值评估。
Feb, 2020
我们提出了一种新的城市时间序列预测模型,通过考虑数据中的周期性,并使用元动态网络根据漂移进行即时调整,以解决概念漂移问题。实验结果表明,我们的设计明显优于现有方法,并可以通过减小它们对分布变化的敏感性来很好地推广到现有的预测模型。
Sep, 2023