NIPSOct, 2023

快速模型去偏置与机器遗忘

TL;DR最近的研究发现,深度神经网络在许多实际场景中可能表现出偏见。本研究提出了一种快速模型去偏方法(FMD),该方法通过显式的反事实概念识别偏见属性,并使用影响函数量化数据样本的影响,进而设计了一种基于机器遗忘的策略来高效有效地消除模型中的偏见。实验证明,与现有先进方法相比,我们的方法在达到更高或相当的准确性的同时,具有更少的偏见和更低的去偏成本要求。