使用有偏表示学习没有偏见的表示

ICMLOct, 2019

使用有偏表示学习没有偏见的表示

Learning De-biased Representations with Biased Representations

Hyojin Bahng, Sanghyuk Chun, Sangdoo Yun, Jaegul Choo, Seong Joon Oh

TL;DR本文介绍了一种用于训练去偏置表示的新框架，通过鼓励其与一组从设计上存在偏差的表示不同来实现。该方法可在许多场景中使用，可以提高模型在不同类别中的泛化能力。

Abstract

Many machine learning algorithms are trained and evaluated by splitting data from a single source into training and test sets. While such focus on in-distribution learning scenarios has led to interesting advancement, it has not been able to tell if models are relying on dataset biases

machine learning biased models de-biasing training data cross-bias generalisation representation learning

发现论文，激发创造

通过解缠分特征增强学习无偏表示

本研究提出了一种基于特征级数据增广技术的去偏方法，通过使培训数据多样化，可以更有效地消除图像分类模型中偏见的影响。

Jul, 2021

透过公平的镜子：减少图像数据集中的偏差

本研究通过重构和最小化预期变量之间的统计相依来解决图像训练数据偏见的问题，使用包含 U-net 和预训练分类器的架构，将所提出的模型与最新的去偏见方法进行了对比，并展示了模型的公正性 - 准确性组合。

Sep, 2022

无监督学习伪属性去偏表示

该论文提出了一种简单且有效的无监督去偏差技术，该方法利用聚类算法在特征嵌入空间识别伪属性，然后采用一种新颖的聚类加权重新调整方案来学习去偏置表示，以防止少数群体被忽视并达到最坏情况下的概括，实验证明其在多个标准基准测试数据集上具有出色的表现，甚至达到了有监督对照组的竞争精度。

Aug, 2021

基于混合样本合成的有限数据情况下分类器去偏

本文研究了深度学习模型中的偏见问题，针对没有关于偏见的先验知识的实际场景，提出了一种新方法，通过合成混合样本来减轻偏见对模型的影响，实验证明我们的方法在有限数据情况下能够有效解决未知偏见问题。

Dec, 2023

公平表征的对比学习

本论文提出了一种采用对比学习的分类器去偏置化的方法，使得模型在保持主要任务性能的前提下，更加公平地代表输入的各种属性，并取得了在 NLP 和计算机视觉四个任务中的优异表现。

Sep, 2021

强调打压偏见在去偏见中的重要性

本研究针对图像分类中的数据集偏差问题，提出了一种基于偏差模型 $f_B$ 的数据样本选择方法来增强偏差，有效提高了 $f_D$ 的训练效果。该方法适用于现有的基于重新加权的去偏差技术，并在合成和真实数据集上实现了最先进的性能。

May, 2022

通过数据集重采样消除表示偏差 (REPAIR)

提出了一种新的数据集修复程序，将偏差最小化建立在给定特征表示的分类器上，通过交替更新分类器参数和数据集重采样权重，使用随机梯度下降解决最小最大问题。实验结果表明，该算法可以显著降低数据集的表征偏差，并提高在其上训练的模型的泛化能力。

Apr, 2019

针对样本特定的去偏方法以获得更优秀的图文模型

本文介绍了一种基于样本特定偏差校正的自监督学习方法，用于改善不均匀假负面样本导致的图像文本数据的质量问题。经过实验证明，此方法在包括医学应用在内的多种数据集上都取得了比传统方法更好的效果。

Apr, 2023

通过自然语言理解中的偏见专家来改进偏见缓解

通过引入偏见专家（bias experts），我们提出了一个新的去偏框架，改善了辅助模型的偏见识别能力，并且在各种挑战性数据集上始终优于现有技术水平。

Dec, 2023

无偏置对比学习

提出了一种能够在缺少真实标签情况下，通过对不同标签数据进行负采样，纠正样本中同标签数据的影响的去偏置对比损失函数，实验证明该函数在视觉、语言和强化学习领域的表示学习中均优于现有的方法，并建立了下游分类任务的泛化界限。

Jul, 2020