CVPRApr, 2024
公平去重:在语义数据集去重中检测和减轻视觉语言公平性差异
FairDeDup: Detecting and Mitigating Vision-Language Fairness Disparities in Semantic Dataset Deduplication
Eric Slyman, Stefan Lee, Scott Cohen, Kushal Kafle
TL;DR通过数据集去重技术,以及针对包含社会偏见的图像 - 描述数据集的剪枝技术,本研究评估去重对训练模型中偏见的影响,并提出了一种易于实施的修改后的 SemDeDup 算法,以减少这些负面影响,实验证明我们提出的 FairDeDup 算法在 FairFace 和 FACET 数据集上提供了更好的公平性指标,并保持了 CLIP benchmark 的零 - shot 性能。