基于混合样本合成的有限数据情况下分类器去偏

Dec, 2023

基于混合样本合成的有限数据情况下分类器去偏

Hybrid Sample Synthesis-based Debiasing of Classifier in Limited Data Setting

Piyush Arora, Pratik Mazumder

TL;DR本文研究了深度学习模型中的偏见问题，针对没有关于偏见的先验知识的实际场景，提出了一种新方法，通过合成混合样本来减轻偏见对模型的影响，实验证明我们的方法在有限数据情况下能够有效解决未知偏见问题。

Abstract

deep learning models are known to suffer from the problem of bias, and researchers have been exploring methods to address this issue. However, most of these methods require prior knowledge of the →

deep learning models bias debiased predictions small dataset regimes unknown bias

发现论文，激发创造

通过解缠分特征增强学习无偏表示

本研究提出了一种基于特征级数据增广技术的去偏方法，通过使培训数据多样化，可以更有效地消除图像分类模型中偏见的影响。

Jul, 2021

语言引导的未知数据集偏差检测与减轻

在这项研究中，我们提出了一种在没有先验知识的情况下通过关键词的部分出现来识别潜在偏见的框架，并进一步提出了两种去偏方法：(a) 通过指定伪标签将其传递给现有的需要先验知识的去偏方法，以及 (b) 通过文本到图像生成模型进行数据增强，使用获得的偏见关键词作为提示。实验结果表明，尽管简单，我们的框架不仅能在没有先验知识的情况下胜过现有方法，而且甚至可以与假设有先验知识的方法媲美。

Jun, 2024

强调打压偏见在去偏见中的重要性

本研究针对图像分类中的数据集偏差问题，提出了一种基于偏差模型 $f_B$ 的数据样本选择方法来增强偏差，有效提高了 $f_D$ 的训练效果。该方法适用于现有的基于重新加权的去偏差技术，并在合成和真实数据集上实现了最先进的性能。

May, 2022

使用有偏表示学习没有偏见的表示

本文介绍了一种用于训练去偏置表示的新框架，通过鼓励其与一组从设计上存在偏差的表示不同来实现。该方法可在许多场景中使用，可以提高模型在不同类别中的泛化能力。

Oct, 2019

消除自然语言理解模型中的未知偏见

本文提出了一种自我去偏方法，以减少 NLU 模型在不事先知道偏差情况下利用偏差的趋势，并表明此方法不仅具有一般性和互补性，而且还能提高模型的整体鲁棒性。

Sep, 2020

通过自然语言理解中的偏见专家来改进偏见缓解

通过引入偏见专家（bias experts），我们提出了一个新的去偏框架，改善了辅助模型的偏见识别能力，并且在各种挑战性数据集上始终优于现有技术水平。

Dec, 2023

通过去偏替换网络来识别和减轻未知偏差

提出了 DebiAN 方法来识别和减少深度图像分类器从数据集中学习到的偏见，该方法包括两个网络，一个 Discoverer 和一个 Classifier，旨在在没有任何偏见注释的情况下找到分类器的多个未知偏见。在现实世界的数据集上，DebiAN 发现的未知偏见可能难以被人类发现，且可实现强大的偏见缓解性能。

Jul, 2022

快速模型去偏置与机器遗忘

最近的研究发现，深度神经网络在许多实际场景中可能表现出偏见。本研究提出了一种快速模型去偏方法（FMD），该方法通过显式的反事实概念识别偏见属性，并使用影响函数量化数据样本的影响，进而设计了一种基于机器遗忘的策略来高效有效地消除模型中的偏见。实验证明，与现有先进方法相比，我们的方法在达到更高或相当的准确性的同时，具有更少的偏见和更低的去偏成本要求。

Oct, 2023

使用合成数据生成器研究偏见：实证证据与哲学解释

本文提出了一种框架来生成具有特定类型偏差和它们的组合的合成数据，以分析在机器学习模型中存在的各种偏差，讨论它们与道德和正义框架的关系，并利用我们提出的合成数据发生器在不同场景中（包括存在不同偏差组合的场景）进行实验，因此分析了偏差对未减轻和减轻的机器学习模型的性能和公平度指标的影响。

Sep, 2022

基于不平衡数据的深度学习中的最大后验比率对合成信息的研究

本研究通过生成合成数据来平衡少数类别数据，以探究类别不平衡数据对深度学习模型的影响。我们提出一种优先选择高信息熵样本的技术，通过最大化生成合成样本在其类别正确区域的概率来增强机器学习算法的准确性和效率。实验结果显示我们技术在增强深度学习模型方面表现出卓越性能。

Jan, 2024