通过模型重用处理概念漂移
本文针对数据流中的概念漂移进行了相关研究,分析法检测,理解和适应等漂移技术的发展趋势,并建立了一个包含三个主要组件的漂移学习框架:概念漂移检测,概念漂移理解和概念漂移适应。同时,本文还列举和讨论了 10 个流行的合成数据集和 14 个公共基准数据集,以评估处理概念漂移的学习算法的性能,涵盖和讨论了概念漂移相关的研究方向。通过提供最新的知识,本综述将直接支持研究人员对概念漂移学习领域的研究发展的理解。
Apr, 2020
这篇论文介绍了一种新的集成学习方法,称为 Diversity and Transfer based Ensemble Learning(DTEL),用于处理概念漂移的增量学习。通过利用保留的历史模型和转移学习,DTEL 可以更有效地处理概念漂移,并通过对 15 个合成数据流和 4 个真实数据流的经验研究证明了其有效性。
Feb, 2017
本文提供了四种文本漂移生成方法,以便生成带有标记漂移的数据集,并使用增量分类器测试它们恢复漂移的能力。结果表明,所有方法在漂移后性能都有所下降,增量支持向量机在准确性和宏 F1 得分方面运行速度最快,恢复了之前的性能水平。
Mar, 2024
这篇论文对文本流场景中的概念漂移适应进行了系统的文献综述,包括文本漂移类别、文本漂移检测类型、模型更新机制、流式挖掘任务、文本表示类型以及文本表示更新机制,并讨论了漂移可视化和模拟,列举了所选论文中使用的真实世界数据集。
Dec, 2023
提出了一种新的持续性学习方法来同时处理学习和存储新信息以及适应先前概念的变化,该方法引入了一个记忆库和一个反应子空间缓冲区来解决数据流挖掘和连续学习两个领域的问题。
Apr, 2021
本文介绍了预测机器学习模型在实际应用中由于系统动态性带来的性能退化问题,对概念漂移的类型做出了统一分类,并对最近十年中提出的基于性能的概念漂移检测方法进行了回顾和分类,还提出了跟踪和评估预测系统中模型性能的主要属性和策略,并探讨了开放性研究挑战和可能的研究方向。
Mar, 2022
本文探讨了针对全局预测模型中的概念漂移提出了两种新方法:误差贡献加权与梯度下降加权,这些方法在三个模拟数据集上的实验证明能有效地提高时间序列预测的准确性。
Apr, 2023
在线学习中,适应漂移数据流是一个重要挑战。本文提出了一种基于局部性和尺度的概念漂移分类方法,并构建了一套 2760 个基准问题,用于评估不同难度级别的漂移检测器。通过对 9 种前沿漂移检测器的综合评估,揭示了它们的优势和弱点,并为未来的研究提供了策略。研究结果还表明漂移的局部性如何影响分类器性能,并提出了不同漂移类别的恢复时间最小化策略。最后,总结了对未来概念漂移研究的经验教训和建议。
Nov, 2023