语言引导的未知数据集偏差检测与减轻

Jun, 2024

语言引导的未知数据集偏差检测与减轻

Language-guided Detection and Mitigation of Unknown Dataset Bias

Zaiying Zhao, Soichiro Kumano, Toshihiko Yamasaki

TL;DR在这项研究中，我们提出了一种在没有先验知识的情况下通过关键词的部分出现来识别潜在偏见的框架，并进一步提出了两种去偏方法：(a) 通过指定伪标签将其传递给现有的需要先验知识的去偏方法，以及 (b) 通过文本到图像生成模型进行数据增强，使用获得的偏见关键词作为提示。实验结果表明，尽管简单，我们的框架不仅能在没有先验知识的情况下胜过现有方法，而且甚至可以与假设有先验知识的方法媲美。

Abstract

dataset bias is a significant problem in training fair classifiers. When attributes unrelated to classification exhibit strong biases towards certain classes, classifiers trained on such dataset may overfit to th

dataset bias fair classifiers mitigation techniques biases identification debiasing methods

发现论文，激发创造

消除自然语言理解模型中的未知偏见

本文提出了一种自我去偏方法，以减少 NLU 模型在不事先知道偏差情况下利用偏差的趋势，并表明此方法不仅具有一般性和互补性，而且还能提高模型的整体鲁棒性。

Sep, 2020

通过自然语言理解中的偏见专家来改进偏见缓解

通过引入偏见专家（bias experts），我们提出了一个新的去偏框架，改善了辅助模型的偏见识别能力，并且在各种挑战性数据集上始终优于现有技术水平。

Dec, 2023

朝向无需假设的偏见缓解

通过建模特征交互来检测相关属性以减轻偏见影响的无假设框架，大大减轻了机器学习模型中针对特定人群的歧视和不公平预测行为。

Jul, 2023

视觉识别中的公正性：减轻偏见的有效策略

本文探讨计算机视觉领域中，当进行看似不相关的任务（如活动识别或图像描述）训练时，模型学习偏见的问题，以及避免学习此类偏见的方法，并在 CelebA 数据集的属性分类任务中使用领域无关的训练技术，有效地减轻了现实世界中的性别偏见。

Nov, 2019

分类任务的常识偏见发现与缓解

基于图像描述提取特征聚类的框架，发现数据集中的敏感关联性，通过调整图像采样权重减轻下游模型偏差问题。

Jan, 2024

使用混合容量模型集成学习模型和排除数据集置偏

本文提出了一种检测和忽略数据集特异性模式的方法，采用高低容量模型的集成训练，以自动捕捉相对浅层的相关性，并确保两个模型学习不重叠的方法，以利于更好地泛化模式。

Nov, 2020

基于混合样本合成的有限数据情况下分类器去偏

本文研究了深度学习模型中的偏见问题，针对没有关于偏见的先验知识的实际场景，提出了一种新方法，通过合成混合样本来减轻偏见对模型的影响，实验证明我们的方法在有限数据情况下能够有效解决未知偏见问题。

Dec, 2023

透过公平的镜子：减少图像数据集中的偏差

本研究通过重构和最小化预期变量之间的统计相依来解决图像训练数据偏见的问题，使用包含 U-net 和预训练分类器的架构，将所提出的模型与最新的去偏见方法进行了对比，并展示了模型的公正性 - 准确性组合。

Sep, 2022

未经筛选的图像 - 文本数据集：揭示人口特征偏见

我们研究了在视觉和语言模型训练中使用大型未筛选数据集的不公平表现，以及如何应对这个问题，研究发现社会偏见在图像生成、图像描述和图像文本嵌入等视觉语言任务中都是一个持续而普遍的问题。

Apr, 2023

通过去偏替换网络来识别和减轻未知偏差

提出了 DebiAN 方法来识别和减少深度图像分类器从数据集中学习到的偏见，该方法包括两个网络，一个 Discoverer 和一个 Classifier，旨在在没有任何偏见注释的情况下找到分类器的多个未知偏见。在现实世界的数据集上，DebiAN 发现的未知偏见可能难以被人类发现，且可实现强大的偏见缓解性能。

Jul, 2022