偏见放大提升少数群体表现

Sep, 2023

Bias Amplification Enhances Minority Group Performance

Gaotang Li, Jiarui Liu, Wei Hu

TL;DR基于引入可学习的辅助变量的 BAM 算法通过扩大偏差，训练模型并在重新加权数据集上继续训练，从而在计算机视觉和自然语言处理的虚假相关基准测试中取得了竞争性的性能，同时发现基于最小类别准确率差异的简单停止准则可以消除对群组注释的需求，或者在最差组准确率上几乎没有损失。

Abstract

neural networks produced by standard training are known to suffer from poor accuracy on rare subgroups despite achieving high accuracy on average, due to the correlations between certain spurious features and labels. Previous approaches based on →

neural networks worst-group loss minimization bam bias amplification scheme spurious correlation benchmarks

发现论文，激发创造

特征偏差放大

本研究通过分析和实验，展示了在分类器中无法避免的一些偏见和可以上保准确认定的其他偏见来源，并提出了两种新的解决方法。这些方法可以明显降低偏见而不损害准确性，甚至可以取得一些准确度的提高。

Dec, 2018

偏见放大的系统研究

机器学习中的偏见放大是一个常见的问题，需要加深对于模型机制的理解，本研究通过控制性实验发现，偏见放大可能由于模型准确度、能力、自信度以及训练数据量等因素产生，同时也可能与分组和分类任务的难易程度相关，研究结果对指导训练机器学习模型具有借鉴意义。

Jan, 2022

强调打压偏见在去偏见中的重要性

本研究针对图像分类中的数据集偏差问题，提出了一种基于偏差模型 $f_B$ 的数据样本选择方法来增强偏差，有效提高了 $f_D$ 的训练效果。该方法适用于现有的基于重新加权的去偏差技术，并在合成和真实数据集上实现了最先进的性能。

May, 2022

借助偏见来抗衡偏见：通过放大数据集偏差来提高模型的稳健性

通过引入一个偏差放大的训练集和一个反偏袒的测试集来评估模型的性能，我们提出为了开发对这些偏差具有稳健性的模型，应该将数据集的偏差放大。实验表明，这种评估体系对模型来说比原始的数据拆分和手工制作的挑战集都更具挑战性。

May, 2023

方向偏差放大

该篇研究关注机器学习系统中偏见放大的问题，提出了一种新的偏差放大度量方法，并分析了其技术假设和规范意义，对其测量提出了建议。

Feb, 2021

男性也会洗衣服：多属性偏见放大

本文拟解决了计算机视觉中的社会偏见问题，主要集中于模型使用多种属性注释时会放大潜在偏见、评估指标的局限性以及提供建议的新度量标准和方法。

Oct, 2022

偏见感知最小化：理解和降低私有 SGD 中的估计器偏差

通过此研究，我们展示了样本梯度范数与 DP-SGD 中使用的梯度估计偏差之间的关系，并提出了 Bias-Aware Minimization（BAM）方法，用以降低私有梯度估计器的偏差，我们还提供了对 CIFAR-10、CIFAR-100 和 ImageNet-32 数据集上隐私 - 效用权衡的实证证据。

Aug, 2023

使用有偏委员会学习去偏置化分类器

通过使用委员会的思想，训练不带伪标签的去偏见分类器，以解决神经网络在训练数据中出现偏倚和虚假相关性的问题，并在五个真实世界的数据集上验证了该方法的超越之处。

Jun, 2022

通过贝叶斯数据选择实现模型训练加速

使用轻量级贝叶斯处理和基于大规模预训练模型的即用型零样本预测器，解决了现实场景中标记错误、重复或有偏差的数据在训练中的问题，提高了模型的训练效率。

Aug, 2023

使用 Datamodels（D3M）进行数据去偏：通过数据选择提高子群体鲁棒性

使用 Data Debiasing with Datamodels (D3M) 方法，在不需要训练组注释或额外的超参数调整的情况下，通过隔离和移除导致模型在少数群体上失败的特定训练样本，可以高效地训练去偏置分类器。

Jun, 2024