OPTWIN: 优化子窗口漂移识别
研究了在流数据场景下,概念漂移对先前学习的模型造成的影响和需要重新训练的需求,提出了一种基于漂移检测和更广泛的稳态/响应态过程的自适应学习算法,并在实验中验证了该算法优于先前基于漂移检测的方法,并可以应用于多种监督学习问题。
Mar, 2020
本文针对数据流中的概念漂移进行了相关研究,分析法检测,理解和适应等漂移技术的发展趋势,并建立了一个包含三个主要组件的漂移学习框架:概念漂移检测,概念漂移理解和概念漂移适应。同时,本文还列举和讨论了10个流行的合成数据集和14个公共基准数据集,以评估处理概念漂移的学习算法的性能,涵盖和讨论了概念漂移相关的研究方向。通过提供最新的知识,本综述将直接支持研究人员对概念漂移学习领域的研究发展的理解。
Apr, 2020
本文介绍了预测机器学习模型在实际应用中由于系统动态性带来的性能退化问题,对概念漂移的类型做出了统一分类,并对最近十年中提出的基于性能的概念漂移检测方法进行了回顾和分类,还提出了跟踪和评估预测系统中模型性能的主要属性和策略,并探讨了开放性研究挑战和可能的研究方向。
Mar, 2022
该研究通过比较基于错误率和数据分布的概念漂移检测器的性能,并评估它们在识别漂移时的可靠性,为实践者提供了指导建议和警报系统的适用性分析。
Nov, 2022
该研究提出了一个新的基准套件来评估AI系统中的概念漂移检测算法,其中考虑了计算性能和检测质量,并且集成在流式学习的框架中。该套件支持合成和真实数据流的评估,有助于科学界得到无监督漂移检测算法的基准表现。
Apr, 2023
在线学习中,适应漂移数据流是一个重要挑战。本文提出了一种基于局部性和尺度的概念漂移分类方法,并构建了一套2760个基准问题,用于评估不同难度级别的漂移检测器。通过对9种前沿漂移检测器的综合评估,揭示了它们的优势和弱点,并为未来的研究提供了策略。研究结果还表明漂移的局部性如何影响分类器性能,并提出了不同漂移类别的恢复时间最小化策略。最后,总结了对未来概念漂移研究的经验教训和建议。
Nov, 2023
通过使用不确定性估计方法作为错误率的替代物来检测漂移,本研究对七个真实世界数据集进行了全面实证评估,旨在减少对标签较少且昂贵的部署后数据的依赖。结果表明,尽管 SWAG 方法表现出更好的校准性,但不确定性估计方法的选择对于检测漂移的整体准确性没有明显影响,甚至最基本的方法也表现出竞争性能,这些发现提供了不确定性基础漂移检测在真实世界安全关键应用中的实际适用性。
Nov, 2023
提出了DriftLens,一种基于深度学习表示的无监督实时概念漂移检测框架,能够比以前的方法更好地检测漂移,在至少11个测试用例中运行速度至少快5倍,并且其检测到的漂移值与实际漂移量非常相关(相关性≥0.85),对参数变化具有鲁棒性。
Jun, 2024
在互联网时代,从海量数据流中进行持续学习变得非常关键。本论文提出了一种基于最大概念差异的新颖概念漂移检测方法MCD-DD,通过对比学习概念嵌入,能够自适应地识别各种形式的概念漂移,而无需依赖标签或统计属性。通过在合成和实际场景下的大量实验证明,该方法在识别概念漂移和实现高解释性的定性分析方面优于现有基准模型。
Jul, 2024