特征偏移检测与校正的对抗学习

Dec, 2023

Adversarial Learning for Feature Shift Detection and Correction

Miriam Barrabes, Daniel Mas Montserrat, Margarita Geleta, Xavier Giro-i-Nieto, Alexander G. Ioannidis

TL;DR利用对抗性学习的原则，结合主流的监督分类器和简单迭代启发式方法，本研究探索了利用多个辨别器的信息来检测和修复数据集之间特征变化，以消除特征变化所带来的分布偏移，优于当前的统计和神经网络技术。

Abstract

data shift is a phenomenon present in many real-world applications, and while there are multiple methods attempting to detect shifts, the task of localizing and correcting the features originating such shifts has not been studied in depth. →

data shift feature shifts adversarial learning corrupted features distribution shift

发现论文，激发创造

数据集转化诊断的统一框架

介绍了使用统一框架来检测数据移位类型并量化其强度，以便改进预测方法，可用于分类和回归任务。

May, 2022

公正中心技术简报：分布偏移的定义和检测

在机器学习任务中，分布偏移是一种常见情况，其表示训练模型使用的数据与实际应用模型的数据不同。本文旨在定义和检测教育环境中的分布偏移，关注标准预测问题，即学习一个以输入序列为输入（预测变量）X=(x_1,x_2,...,x_m) 并生成输出 Y=f (X) 的模型。

May, 2024

领域自适应的判别式主动学习

本文提出了一种用于区域自适应的主动学习方法，通过使用三阶段的主动对抗训练神经网络（包括不变的特征空间学习阶段、不确定性和多样性准则及其折衷的查询策略，以及使用查询的目标标签重新训练阶段)，该方法可以减少数据标注的工作量，对四个基准数据集进行的实证比较表明了该方法的有效性。

May, 2020

响亮地失败：检测数据集漂移方法的实证研究

本文探讨机器学习系统在面对各类输入时，如何通过检测数据集漂移并量化其恶性，从而建立高鲁棒性的系统，同时提出使用预训练分类器的双样本测试法在多种数据集漂移情况下表现最佳，且判别方法有助于定性确定数据集漂移的影响。

Oct, 2018

特征分布偏移消减的对比预训练方法用于入侵检测

基于 SwapCon 模型，我们提出了一种在预训练阶段压缩移不变特征信息并在微调阶段精细调整的机器学习模型，证明这种预训练范式在网络入侵检测问题中可以提高对特征分布变化的鲁棒性超过 8%，并且比基于 eXtreme Gradient Boosting (XGBoost) 和 K - 最近邻 (KNN) 的模型表现更好。

Apr, 2024

分布转移下的监督算法公平性：一项综述

监督的公平感知机器学习在面临数据分布从源领域到目标领域的变化时，是一个新兴的领域，解决了在实现公正和无偏预测方面的挑战。本综述提供各种类型的分布变化的总结，并全面调查了现有方法，重点介绍了文献中常用的六种方法。此外，本综述列出了可用于经验研究的公开数据集和评估指标。我们进一步探讨了与相关研究领域的相互连接，讨论了重大挑战，并确定了未来研究的潜在方向。

Feb, 2024

锐度与位移感知的自监督学习

本文提出了 Sharpness & Shift-Aware 对比学习（SSA-CLR）方法，旨在从无标签数据中提取有意义的特征并应用于分类任务，通过显式建模、最小化特征提取器的锐度和数据分布的偏移差异，获得更好的分类表现和更鲁棒的特征。

May, 2023

朝着可行的顺序偏移检测器

部署的机器学习模型性能受到分布转移的有害影响的认识日益增长。因此，在相关成本累积之前，检测这些转移的兴趣日益增长。然而，现有的研究往往忽视可行性的顶级部署序列转移检测器的重要需求，限制了它们的广泛采用。我们确定了三个这样的需求，强调了与之满足相关的现有工作，并为未来研究提出了有影响力的方向。

Jul, 2023

分布偏移下的不变异常检测：因果视角

利用因果推断的工具，通过确保不变的表示以增强异常检测模型对不同类型的分布转移的鲁棒性，并通过实验评估证明在分布转移情况下，使用我们提出的正则化项的模型显示出显著的鲁棒性提升和良好的超越分布性能。

Dec, 2023

在线特性更新提高在线（广义）标签转移适应性

在在线设置中，解决标签偏移和缺失标签的问题，通过使用未标记数据进行在线特征更新进行特征提取，从而改善预测模型的方法为 OLS-OFU，该方法在理论分析和实证研究中证实了其在处理领域变化时的有效性和鲁棒性。

Feb, 2024