本研究提出了一个全面的概念漂移类型的分类法并支持定量分析,从而为解决这一问题提供了基础。
Nov, 2015
本文针对数据流中的概念漂移进行了相关研究,分析法检测,理解和适应等漂移技术的发展趋势,并建立了一个包含三个主要组件的漂移学习框架:概念漂移检测,概念漂移理解和概念漂移适应。同时,本文还列举和讨论了 10 个流行的合成数据集和 14 个公共基准数据集,以评估处理概念漂移的学习算法的性能,涵盖和讨论了概念漂移相关的研究方向。通过提供最新的知识,本综述将直接支持研究人员对概念漂移学习领域的研究发展的理解。
Apr, 2020
我们提出了一种基于平行坐标的新型可视化模型,通过连接连续时间窗口中分布的均值,将漂移显示为这些分布的变化,用于解释机器学习模型在选择漂移点时的决策,并能检测和描述概念漂移,为进一步研究开辟了可能性。
Jun, 2024
概念漂移对机器学习模型产生不准确的影响,并且在流式数据背景下,多数研究假设连续的数据点之间是独立的。本研究发现时序依赖性对采样过程有很大影响,因此需要对现有定义进行重大修改,特别是平稳性的概念不适用于这种设置,而需要探讨替代方案。通过数值实验证明了这些替代形式的概念能够描述可观察的学习行为。
Dec, 2023
本文提供了四种文本漂移生成方法,以便生成带有标记漂移的数据集,并使用增量分类器测试它们恢复漂移的能力。结果表明,所有方法在漂移后性能都有所下降,增量支持向量机在准确性和宏 F1 得分方面运行速度最快,恢复了之前的性能水平。
Mar, 2024
本文提供了对无监督数据流中概念漂移的文献综述,主要关注概念漂移的检测和定位方法,并提供了对各种方法的系统性比较和在真实场景中的使用指南。另外,本文还探讨了解释概念漂移的新兴话题。
Oct, 2023
该研究通过比较基于错误率和数据分布的概念漂移检测器的性能,并评估它们在识别漂移时的可靠性,为实践者提供了指导建议和警报系统的适用性分析。
Nov, 2022
本文介绍了预测机器学习模型在实际应用中由于系统动态性带来的性能退化问题,对概念漂移的类型做出了统一分类,并对最近十年中提出的基于性能的概念漂移检测方法进行了回顾和分类,还提出了跟踪和评估预测系统中模型性能的主要属性和策略,并探讨了开放性研究挑战和可能的研究方向。
Mar, 2022
通过实验证明模型输出置信度与概念漂移存在关联性,并提倡在未来的比较研究中更加重视不确定性估计。
Mar, 2023
在线学习中,适应漂移数据流是一个重要挑战。本文提出了一种基于局部性和尺度的概念漂移分类方法,并构建了一套 2760 个基准问题,用于评估不同难度级别的漂移检测器。通过对 9 种前沿漂移检测器的综合评估,揭示了它们的优势和弱点,并为未来的研究提供了策略。研究结果还表明漂移的局部性如何影响分类器性能,并提出了不同漂移类别的恢复时间最小化策略。最后,总结了对未来概念漂移研究的经验教训和建议。
Nov, 2023