OPTWIN: 优化子窗口漂移识别

May, 2023

OPTWIN: Drift identification with optimal sub-windows

Mauro Dalle Lucca Tosi, Martin Theobald

TL;DR本研究提出了一种名为OPTWIN的算法，用于检测数据流中的概念漂移，通过考虑学习器错误率的平均值和方差将滑动窗口分为两个子窗口，其中分割点是使用t或f检验发生了统计学上显著的差异的最早时间点。在7个综合和实际数据集上，OPTWIN在MOA框架中超过了基线算法的F1分数，同时保持更低的检测延迟并节省高达21％的重新训练模型时间。

Abstract

online learning (OL) is a field of research that is increasingly gaining attention both in academia and industry. One of the main challenges of OL is the inherent presence of concept drifts, which are commonly de

发现论文，激发创造

描述概念漂移

本研究提出了一个全面的概念漂移类型的分类法并支持定量分析，从而为解决这一问题提供了基础。

Nov, 2015

DriftSurf：基于概念漂移的风险竞争学习算法

研究了在流数据场景下，概念漂移对先前学习的模型造成的影响和需要重新训练的需求，提出了一种基于漂移检测和更广泛的稳态/响应态过程的自适应学习算法，并在实验中验证了该算法优于先前基于漂移检测的方法，并可以应用于多种监督学习问题。

Mar, 2020

概念漂移下的学习：一份综述

本文针对数据流中的概念漂移进行了相关研究，分析法检测，理解和适应等漂移技术的发展趋势，并建立了一个包含三个主要组件的漂移学习框架：概念漂移检测，概念漂移理解和概念漂移适应。同时，本文还列举和讨论了10个流行的合成数据集和14个公共基准数据集，以评估处理概念漂移的学习算法的性能，涵盖和讨论了概念漂移相关的研究方向。通过提供最新的知识，本综述将直接支持研究人员对概念漂移学习领域的研究发展的理解。

Apr, 2020

从概念漂移到模型退化：性能感知漂移检测器综述

本文介绍了预测机器学习模型在实际应用中由于系统动态性带来的性能退化问题，对概念漂移的类型做出了统一分类，并对最近十年中提出的基于性能的概念漂移检测方法进行了回顾和分类，还提出了跟踪和评估预测系统中模型性能的主要属性和策略，并探讨了开放性研究挑战和可能的研究方向。

Mar, 2022

概念漂移检测器是可靠的警报系统吗？-- 一项比较研究

该研究通过比较基于错误率和数据分布的概念漂移检测器的性能，并评估它们在识别漂移时的可靠性，为实践者提供了指导建议和警报系统的适用性分析。

Nov, 2022

计算性能感知的无监督概念漂移检测基准测试

该研究提出了一个新的基准套件来评估AI系统中的概念漂移检测算法，其中考虑了计算性能和检测质量，并且集成在流式学习的框架中。该套件支持合成和真实数据流的评估，有助于科学界得到无监督漂移检测算法的基准表现。

Apr, 2023

数据流中概念漂移局部性的全面分析

在线学习中，适应漂移数据流是一个重要挑战。本文提出了一种基于局部性和尺度的概念漂移分类方法，并构建了一套2760个基准问题，用于评估不同难度级别的漂移检测器。通过对9种前沿漂移检测器的综合评估，揭示了它们的优势和弱点，并为未来的研究提供了策略。研究结果还表明漂移的局部性如何影响分类器性能，并提出了不同漂移类别的恢复时间最小化策略。最后，总结了对未来概念漂移研究的经验教训和建议。

Nov, 2023

数据流中漂移检测的不确定性估计技术的实证研究

通过使用不确定性估计方法作为错误率的替代物来检测漂移，本研究对七个真实世界数据集进行了全面实证评估，旨在减少对标签较少且昂贵的部署后数据的依赖。结果表明，尽管 SWAG 方法表现出更好的校准性，但不确定性估计方法的选择对于检测漂移的整体准确性没有明显影响，甚至最基本的方法也表现出竞争性能，这些发现提供了不确定性基础漂移检测在真实世界安全关键应用中的实际适用性。

Nov, 2023

深度学习表示中的无监督概念漂移实时检测

提出了DriftLens，一种基于深度学习表示的无监督实时概念漂移检测框架，能够比以前的方法更好地检测漂移，在至少11个测试用例中运行速度至少快5倍，并且其检测到的漂移值与实际漂移量非常相关（相关性≥0.85），对参数变化具有鲁棒性。

Jun, 2024

在线漂移检测与最大概念差异

在互联网时代，从海量数据流中进行持续学习变得非常关键。本论文提出了一种基于最大概念差异的新颖概念漂移检测方法MCD-DD，通过对比学习概念嵌入，能够自适应地识别各种形式的概念漂移，而无需依赖标签或统计属性。通过在合成和实际场景下的大量实验证明，该方法在识别概念漂移和实现高解释性的定性分析方面优于现有基准模型。

Jul, 2024