基于混合样本合成的有限数据情况下分类器去偏
在这项研究中,我们提出了一种在没有先验知识的情况下通过关键词的部分出现来识别潜在偏见的框架,并进一步提出了两种去偏方法:(a) 通过指定伪标签将其传递给现有的需要先验知识的去偏方法,以及 (b) 通过文本到图像生成模型进行数据增强,使用获得的偏见关键词作为提示。实验结果表明,尽管简单,我们的框架不仅能在没有先验知识的情况下胜过现有方法,而且甚至可以与假设有先验知识的方法媲美。
Jun, 2024
本研究针对图像分类中的数据集偏差问题,提出了一种基于偏差模型 $f_B$ 的数据样本选择方法来增强偏差,有效提高了 $f_D$ 的训练效果。该方法适用于现有的基于重新加权的去偏差技术,并在合成和真实数据集上实现了最先进的性能。
May, 2022
本文介绍了一种用于训练去偏置表示的新框架,通过鼓励其与一组从设计上存在偏差的表示不同来实现。该方法可在许多场景中使用,可以提高模型在不同类别中的泛化能力。
Oct, 2019
本文提出了一种自我去偏方法,以减少 NLU 模型在不事先知道偏差情况下利用偏差的趋势,并表明此方法不仅具有一般性和互补性,而且还能提高模型的整体鲁棒性。
Sep, 2020
通过引入偏见专家(bias experts),我们提出了一个新的去偏框架,改善了辅助模型的偏见识别能力,并且在各种挑战性数据集上始终优于现有技术水平。
Dec, 2023
提出了 DebiAN 方法来识别和减少深度图像分类器从数据集中学习到的偏见,该方法包括两个网络,一个 Discoverer 和一个 Classifier,旨在在没有任何偏见注释的情况下找到分类器的多个未知偏见。在现实世界的数据集上,DebiAN 发现的未知偏见可能难以被人类发现,且可实现强大的偏见缓解性能。
Jul, 2022
最近的研究发现,深度神经网络在许多实际场景中可能表现出偏见。本研究提出了一种快速模型去偏方法(FMD),该方法通过显式的反事实概念识别偏见属性,并使用影响函数量化数据样本的影响,进而设计了一种基于机器遗忘的策略来高效有效地消除模型中的偏见。实验证明,与现有先进方法相比,我们的方法在达到更高或相当的准确性的同时,具有更少的偏见和更低的去偏成本要求。
Oct, 2023
本文提出了一种框架来生成具有特定类型偏差和它们的组合的合成数据,以分析在机器学习模型中存在的各种偏差,讨论它们与道德和正义框架的关系,并利用我们提出的合成数据发生器在不同场景中(包括存在不同偏差组合的场景)进行实验,因此分析了偏差对未减轻和减轻的机器学习模型的性能和公平度指标的影响。
Sep, 2022
本研究通过生成合成数据来平衡少数类别数据,以探究类别不平衡数据对深度学习模型的影响。我们提出一种优先选择高信息熵样本的技术,通过最大化生成合成样本在其类别正确区域的概率来增强机器学习算法的准确性和效率。实验结果显示我们技术在增强深度学习模型方面表现出卓越性能。
Jan, 2024