学习漂移目标概念
利用差异的理念,我们对批处理情景下学习漂移分布的问题进行了新的分析,并证明了基于假设集和分布的差异的 Rademacher 复杂度的学习界限,包括漂移 PAC 情景和跟踪情景。 我们提出了一种新算法,利用这些学习保证,我们展示了该算法可以被表述为一个简单的 QP。
May, 2012
我们开发和分析了一种普适技术,可以在未知分布漂移的情况下进行学习。给定一个来自漂移分布的最后 $T$ 步的独立观测序列,我们的算法在时刻 $T$ 对当前分布进行从容学习。与先前的工作不同,我们的技术不需要关于漂移幅度的先验知识,而是根据样本数据进行算法调整。我们的算法学习了一类函数,其误差几乎与预先了解漂移幅度的学习算法相同。此外,由于我们的算法适应数据,它可以保证比依赖漂移松限制的算法具有更好的学习误差。
May, 2023
研究了在流数据场景下,概念漂移对先前学习的模型造成的影响和需要重新训练的需求,提出了一种基于漂移检测和更广泛的稳态 / 响应态过程的自适应学习算法,并在实验中验证了该算法优于先前基于漂移检测的方法,并可以应用于多种监督学习问题。
Mar, 2020
概念漂移对机器学习模型产生不准确的影响,并且在流式数据背景下,多数研究假设连续的数据点之间是独立的。本研究发现时序依赖性对采样过程有很大影响,因此需要对现有定义进行重大修改,特别是平稳性的概念不适用于这种设置,而需要探讨替代方案。通过数值实验证明了这些替代形式的概念能够描述可观察的学习行为。
Dec, 2023
本文研究了分布式概念漂移下的联邦学习,提出了两种新的聚类算法以适应数据异质性和时间变化的漂移,并且通过实验验证表明它们的准确性显著优于现有的基线算法,接近理想算法。
Jun, 2022
本文针对数据流中的概念漂移进行了相关研究,分析法检测,理解和适应等漂移技术的发展趋势,并建立了一个包含三个主要组件的漂移学习框架:概念漂移检测,概念漂移理解和概念漂移适应。同时,本文还列举和讨论了 10 个流行的合成数据集和 14 个公共基准数据集,以评估处理概念漂移的学习算法的性能,涵盖和讨论了概念漂移相关的研究方向。通过提供最新的知识,本综述将直接支持研究人员对概念漂移学习领域的研究发展的理解。
Apr, 2020
提出了一种自适应方法,在非稳态环境下提供正式质量保证的弱监督学习,通过使用提供每个数据点的正确分类的独立嘈杂信号的弱监督学习源来推断一系列数据的未知标签,并针对准确性可能随时间漂移的非稳态情况进行了重点研究,该算法不需要先验假设并且基于输入进行自适应调整。该算法保证了在过去观察窗口内,最小化估计误差方差和漂移误差的平衡下,弱监督源的当前准确性。实验表明,与固定窗口大小策略不同,该方法可动态选择窗口大小,以保持良好性能。
Jun, 2023
本文探讨了针对文档分类中的数据不均衡和概念漂移问题,通过运用不同的优化算法进行处理,发现基于不变风险最小化和谱解耦算法优于现有基于采样的方法,尤其在少数类的情况下表现更加优越。
Mar, 2022