学习漂移目标概念

May, 2015

Learning with a Drifting Target Concept

Steve Hanneke, Varun Kanade, Liu Yang

TL;DR本文研究了在存在漂移的目标概念的情况下的学习问题，提出了误差率的上界，并给出了一个能够适应目标概念不断漂移的算法的一般结果，其中包括了该设置的积极学习变体，并提供了得到错误率上界所需的点标签查询数量的界限。

Abstract

We study the problem of learning in the presence of a drifting target concept. Specifically, we provide bounds on the error rate at a given time, given a learner with access to a history of independent samples la

learning drifting target concept error rate polynomial-time algorithms active learning

发现论文，激发创造

漂移分布学习的新分析和算法

利用差异的理念，我们对批处理情景下学习漂移分布的问题进行了新的分析，并证明了基于假设集和分布的差异的 Rademacher 复杂度的学习界限，包括漂移 PAC 情景和跟踪情景。我们提出了一种新算法，利用这些学习保证，我们展示了该算法可以被表述为一个简单的 QP。

May, 2012

学习漂移离散分布的改进算法

我们提出了一种适用于在分布漂移下学习离散分布的新的自适应算法。

Mar, 2024

一种适应未知分布漂移学习的算法

我们开发和分析了一种普适技术，可以在未知分布漂移的情况下进行学习。给定一个来自漂移分布的最后 $T$ 步的独立观测序列，我们的算法在时刻 $T$ 对当前分布进行从容学习。与先前的工作不同，我们的技术不需要关于漂移幅度的先验知识，而是根据样本数据进行算法调整。我们的算法学习了一类函数，其误差几乎与预先了解漂移幅度的学习算法相同。此外，由于我们的算法适应数据，它可以保证比依赖漂移松限制的算法具有更好的学习误差。

May, 2023

DriftSurf：基于概念漂移的风险竞争学习算法

研究了在流数据场景下，概念漂移对先前学习的模型造成的影响和需要重新训练的需求，提出了一种基于漂移检测和更广泛的稳态 / 响应态过程的自适应学习算法，并在实验中验证了该算法优于先前基于漂移检测的方法，并可以应用于多种监督学习问题。

Mar, 2020

关于相关数据概念漂移的一点注记

概念漂移对机器学习模型产生不准确的影响，并且在流式数据背景下，多数研究假设连续的数据点之间是独立的。本研究发现时序依赖性对采样过程有很大影响，因此需要对现有定义进行重大修改，特别是平稳性的概念不适用于这种设置，而需要探讨替代方案。通过数值实验证明了这些替代形式的概念能够描述可观察的学习行为。

Dec, 2023

分布式概念漂移下的联邦学习

本文研究了分布式概念漂移下的联邦学习，提出了两种新的聚类算法以适应数据异质性和时间变化的漂移，并且通过实验验证表明它们的准确性显著优于现有的基线算法，接近理想算法。

Jun, 2022

概念漂移下的学习：一份综述

本文针对数据流中的概念漂移进行了相关研究，分析法检测，理解和适应等漂移技术的发展趋势，并建立了一个包含三个主要组件的漂移学习框架：概念漂移检测，概念漂移理解和概念漂移适应。同时，本文还列举和讨论了 10 个流行的合成数据集和 14 个公共基准数据集，以评估处理概念漂移的学习算法的性能，涵盖和讨论了概念漂移相关的研究方向。通过提供最新的知识，本综述将直接支持研究人员对概念漂移学习领域的研究发展的理解。

Apr, 2020

理解概念漂移

本文探讨了概念漂移对机器学习实际应用的影响以及应对概念漂移的方法，提出了定量分析方法和漂移分析工具，并通过三个实际学习任务的应用验证了它们的有效性。

Apr, 2017

具有漂移数据的弱监督自适应方法

提出了一种自适应方法，在非稳态环境下提供正式质量保证的弱监督学习，通过使用提供每个数据点的正确分类的独立嘈杂信号的弱监督学习源来推断一系列数据的未知标签，并针对准确性可能随时间漂移的非稳态情况进行了重点研究，该算法不需要先验假设并且基于输入进行自适应调整。该算法保证了在过去观察窗口内，最小化估计误差方差和漂移误差的平衡下，弱监督源的当前准确性。实验表明，与固定窗口大小策略不同，该方法可动态选择窗口大小，以保持良好性能。

Jun, 2023

标签级别下时序概念漂移下的改进多标记分类：重新思考标签组鲁棒性算法

本文探讨了针对文档分类中的数据不均衡和概念漂移问题，通过运用不同的优化算法进行处理，发现基于不变风险最小化和谱解耦算法优于现有基于采样的方法，尤其在少数类的情况下表现更加优越。

Mar, 2022