支持向量机的概念漂移可视化与滑动窗口
本文针对数据流中的概念漂移进行了相关研究,分析法检测,理解和适应等漂移技术的发展趋势,并建立了一个包含三个主要组件的漂移学习框架:概念漂移检测,概念漂移理解和概念漂移适应。同时,本文还列举和讨论了 10 个流行的合成数据集和 14 个公共基准数据集,以评估处理概念漂移的学习算法的性能,涵盖和讨论了概念漂移相关的研究方向。通过提供最新的知识,本综述将直接支持研究人员对概念漂移学习领域的研究发展的理解。
Apr, 2020
概念漂移对机器学习模型产生不准确的影响,并且在流式数据背景下,多数研究假设连续的数据点之间是独立的。本研究发现时序依赖性对采样过程有很大影响,因此需要对现有定义进行重大修改,特别是平稳性的概念不适用于这种设置,而需要探讨替代方案。通过数值实验证明了这些替代形式的概念能够描述可观察的学习行为。
Dec, 2023
本文提供了四种文本漂移生成方法,以便生成带有标记漂移的数据集,并使用增量分类器测试它们恢复漂移的能力。结果表明,所有方法在漂移后性能都有所下降,增量支持向量机在准确性和宏 F1 得分方面运行速度最快,恢复了之前的性能水平。
Mar, 2024
本文提供了对无监督数据流中概念漂移的文献综述,主要关注概念漂移的检测和定位方法,并提供了对各种方法的系统性比较和在真实场景中的使用指南。另外,本文还探讨了解释概念漂移的新兴话题。
Oct, 2023
本文介绍了预测机器学习模型在实际应用中由于系统动态性带来的性能退化问题,对概念漂移的类型做出了统一分类,并对最近十年中提出的基于性能的概念漂移检测方法进行了回顾和分类,还提出了跟踪和评估预测系统中模型性能的主要属性和策略,并探讨了开放性研究挑战和可能的研究方向。
Mar, 2022
提出了 DriftLens,一种基于深度学习表示的无监督实时概念漂移检测框架,能够比以前的方法更好地检测漂移,在至少 11 个测试用例中运行速度至少快 5 倍,并且其检测到的漂移值与实际漂移量非常相关(相关性≥0.85),对参数变化具有鲁棒性。
Jun, 2024
介绍了一种利用 Kullback-Leibler 散度来监控多维数据流概率分布变化,以预测概念漂移事件并了解其本质的新方法,并探讨了其在预测维护等实际任务中的应用。
Oct, 2022