SelecMix: 通过对立对采样进行偏差学习

Nov, 2022

SelecMix: 通过对立对采样进行偏差学习

SelecMix: Debiased Learning by Contradicting-pair Sampling

Inwoo Hwang, Sangjun Lee, Yunhyeok Kwak, Seong Joon Oh, Damien Teney...

TL;DR提出一种新的数据增广方法 SelecMix，旨在解决神经网络训练中数据偏差带来的问题，并在标准基准测试中证明了其有效性，尤其是在标签噪声情况下。

Abstract

neural networks trained with ERM (empirical risk minimization) sometimes learn unintended decision rules, in particular when their training data is biased, i.e., when training labels are strongly correlated with undesirable features. To prevent a network from learning such features, re

neural networks training data bias augmentation selecmix label noise

发现论文，激发创造

mixup：超越经验风险最小化

这篇论文提出了一种名为 mixup 的学习原则，通过训练神经网络的凸组合来缓解其记忆和对抗性示例敏感等问题，实验表明 mixup 提高了最先进的神经网络结构的泛化性能，并减少了恶意标签的记忆，增强了对抗性示例的鲁棒性，并稳定了生成对抗网络的训练。

Oct, 2017

通过解缠分特征增强学习无偏表示

本研究提出了一种基于特征级数据增广技术的去偏方法，通过使培训数据多样化，可以更有效地消除图像分类模型中偏见的影响。

Jul, 2021

选择性混合有助于处理分布转移，但不仅仅因为混合

研究表明，特定样本对之间的非随机选择使训练分布受到影响，并通过与混合无关的方法提高了泛化能力。二元分类中的 Mixup 跨类混合隐含地对数据进行重新采样，从而实现了标签转移的经典解决方案。选择性混合和重新采样方法存在新的等价性，相关的优势可以更好地结合。

May, 2023

自己混合你的一对

我们提出了一种用于回归的有监督对比学习方法 SupReMix，通过整合更丰富的有序信息，它能够培养连续有序的回归数据表示，从而显著提高回归性能，并在转移学习、样本不平衡和样本数量较少等回归挑战中表现优异。

Sep, 2023

拓展边界：Mixup 对神经崩溃的影响

混合增强是一种数据增强策略，通过训练实例及其标签的凸组合来增强深度神经网络的鲁棒性和校准性。本研究深入探讨了混合增强对深度网络训练数据最后一层激活的影响，发现其激活结果呈现独特的几何配置，揭示了混合增强增强模型校准的机制。同时进行理论分析，证明了对于特征模型不受约束的情况下，基于混合增强损失的分类器形成了一个简单的 ETF 的最优最后一层特征。

Feb, 2024

无偏置对比学习

提出了一种能够在缺少真实标签情况下，通过对不同标签数据进行负采样，纠正样本中同标签数据的影响的去偏置对比损失函数，实验证明该函数在视觉、语言和强化学习领域的表示学习中均优于现有的方法，并建立了下游分类任务的泛化界限。

Jul, 2020

混合样式训练数据依赖性研究

本文探讨 Mixup 训练范例如何提高分类器对数据结构的适应性与推广性，并通过计算得出 Mixup 最优分类器的封闭形式，证明使用 Mixup loss 训练的分类器可能不会最小化数据的经验损失。此外，我们还给出了 Mixup 训练的广义条件和特定数据集上单一标准训练的数据分类器相同的证明。

Oct, 2021

无偏监督对比学习

本文提出了一种基于边界的理论框架，并推导出了一种新的有监督对比损失（epsilon-SupInfoNCE）和一种有效的去偏差正则化损失（FairKL），这些方法可以用于从偏差数据中学习无偏模型，并在多个偏差数据集上实现了最先进的性能。

Nov, 2022

使用 Mixup 实现寻找最优决策边界的可证明收益

本文研究了一种名为 Mixup 的数据增广技术，发现它可以显著地降低寻找最优决策边界的样本复杂度，而不同的掩蔽 Mixup 风格技术有可能扭曲训练损失和导致其最小化器收敛到考虑测试精度的次优分类器。

Jun, 2023

混合训练：改进的深度神经网络校准和预测不确定性

通过将混合样本与标签训练，混合训练方法 (mixup) 在图像分类任务中表现出更好的数据增强效果，并且得到了更好的预测可靠性，表现为更好的校准性和更少的过于自信的预测。

May, 2019