DriftSurf:基于概念漂移的风险竞争学习算法
本文针对数据流中的概念漂移进行了相关研究,分析法检测,理解和适应等漂移技术的发展趋势,并建立了一个包含三个主要组件的漂移学习框架:概念漂移检测,概念漂移理解和概念漂移适应。同时,本文还列举和讨论了 10 个流行的合成数据集和 14 个公共基准数据集,以评估处理概念漂移的学习算法的性能,涵盖和讨论了概念漂移相关的研究方向。通过提供最新的知识,本综述将直接支持研究人员对概念漂移学习领域的研究发展的理解。
Apr, 2020
本文研究了分布式概念漂移下的联邦学习,提出了两种新的聚类算法以适应数据异质性和时间变化的漂移,并且通过实验验证表明它们的准确性显著优于现有的基线算法,接近理想算法。
Jun, 2022
该论文提出了一种基于特征分类器的不依赖于数据分布或特定应用的无监督增量漂移检测算法,以实现在数据流中可靠地检测和适应概念漂移,并展示了在 6 个漂移诱导数据集和 4 个来自网络安全领域的附加数据集上的实验评估结果,表明该算法与无监督特征漂移检测器相比具有更少的误警,可以信任且适用性广泛。
Mar, 2017
本文研究了在存在漂移的目标概念的情况下的学习问题,提出了误差率的上界,并给出了一个能够适应目标概念不断漂移的算法的一般结果,其中包括了该设置的积极学习变体,并提供了得到错误率上界所需的点标签查询数量的界限。
May, 2015
本文提供了四种文本漂移生成方法,以便生成带有标记漂移的数据集,并使用增量分类器测试它们恢复漂移的能力。结果表明,所有方法在漂移后性能都有所下降,增量支持向量机在准确性和宏 F1 得分方面运行速度最快,恢复了之前的性能水平。
Mar, 2024
在线学习中,适应漂移数据流是一个重要挑战。本文提出了一种基于局部性和尺度的概念漂移分类方法,并构建了一套 2760 个基准问题,用于评估不同难度级别的漂移检测器。通过对 9 种前沿漂移检测器的综合评估,揭示了它们的优势和弱点,并为未来的研究提供了策略。研究结果还表明漂移的局部性如何影响分类器性能,并提出了不同漂移类别的恢复时间最小化策略。最后,总结了对未来概念漂移研究的经验教训和建议。
Nov, 2023
本文提出了一种基于社交网络理论的动态集合方法:Scale-free Network Regressor(SFNR),以检测数据流中的概念漂移。通过使用 Adaptive Window 算法,我们实现了更好的性能和准确性,尤其是在概念漂移的情况下,并与其他现有算法进行了比较。
Apr, 2023
我们开发和分析了一种普适技术,可以在未知分布漂移的情况下进行学习。给定一个来自漂移分布的最后 $T$ 步的独立观测序列,我们的算法在时刻 $T$ 对当前分布进行从容学习。与先前的工作不同,我们的技术不需要关于漂移幅度的先验知识,而是根据样本数据进行算法调整。我们的算法学习了一类函数,其误差几乎与预先了解漂移幅度的学习算法相同。此外,由于我们的算法适应数据,它可以保证比依赖漂移松限制的算法具有更好的学习误差。
May, 2023
该研究提出 Tornado 框架,它实现了一些不同学习风格的分类器和各种漂移检测算法,用于构建模型以针对不断变化的数据流,评估结果表明,最佳分类器与检测器选择不仅取决于数据流的特征而且会随着流的变化而演变。
Sep, 2017