特征偏移检测与校正的对抗学习
在机器学习任务中,分布偏移是一种常见情况,其表示训练模型使用的数据与实际应用模型的数据不同。本文旨在定义和检测教育环境中的分布偏移,关注标准预测问题,即学习一个以输入序列为输入(预测变量)X=(x_1,x_2,...,x_m) 并生成输出 Y=f (X) 的模型。
May, 2024
本文提出了一种用于区域自适应的主动学习方法,通过使用三阶段的主动对抗训练神经网络(包括不变的特征空间学习阶段、不确定性和多样性准则及其折衷的查询策略,以及使用查询的目标标签重新训练阶段),该方法可以减少数据标注的工作量,对四个基准数据集进行的实证比较表明了该方法的有效性。
May, 2020
本文探讨机器学习系统在面对各类输入时,如何通过检测数据集漂移并量化其恶性,从而建立高鲁棒性的系统,同时提出使用预训练分类器的双样本测试法在多种数据集漂移情况下表现最佳,且判别方法有助于定性确定数据集漂移的影响。
Oct, 2018
基于 SwapCon 模型,我们提出了一种在预训练阶段压缩移不变特征信息并在微调阶段精细调整的机器学习模型,证明这种预训练范式在网络入侵检测问题中可以提高对特征分布变化的鲁棒性超过 8%,并且比基于 eXtreme Gradient Boosting (XGBoost) 和 K - 最近邻 (KNN) 的模型表现更好。
Apr, 2024
监督的公平感知机器学习在面临数据分布从源领域到目标领域的变化时,是一个新兴的领域,解决了在实现公正和无偏预测方面的挑战。本综述提供各种类型的分布变化的总结,并全面调查了现有方法,重点介绍了文献中常用的六种方法。此外,本综述列出了可用于经验研究的公开数据集和评估指标。我们进一步探讨了与相关研究领域的相互连接,讨论了重大挑战,并确定了未来研究的潜在方向。
Feb, 2024
本文提出了 Sharpness & Shift-Aware 对比学习(SSA-CLR)方法,旨在从无标签数据中提取有意义的特征并应用于分类任务,通过显式建模、最小化特征提取器的锐度和数据分布的偏移差异,获得更好的分类表现和更鲁棒的特征。
May, 2023
部署的机器学习模型性能受到分布转移的有害影响的认识日益增长。因此,在相关成本累积之前,检测这些转移的兴趣日益增长。然而,现有的研究往往忽视可行性的顶级部署序列转移检测器的重要需求,限制了它们的广泛采用。我们确定了三个这样的需求,强调了与之满足相关的现有工作,并为未来研究提出了有影响力的方向。
Jul, 2023
利用因果推断的工具,通过确保不变的表示以增强异常检测模型对不同类型的分布转移的鲁棒性,并通过实验评估证明在分布转移情况下,使用我们提出的正则化项的模型显示出显著的鲁棒性提升和良好的超越分布性能。
Dec, 2023
在在线设置中,解决标签偏移和缺失标签的问题,通过使用未标记数据进行在线特征更新进行特征提取,从而改善预测模型的方法为 OLS-OFU,该方法在理论分析和实证研究中证实了其在处理领域变化时的有效性和鲁棒性。
Feb, 2024