CVPRApr, 2024

公平去重:在语义数据集去重中检测和减轻视觉语言公平性差异

TL;DR通过数据集去重技术,以及针对包含社会偏见的图像 - 描述数据集的剪枝技术,本研究评估去重对训练模型中偏见的影响,并提出了一种易于实施的修改后的 SemDeDup 算法,以减少这些负面影响,实验证明我们提出的 FairDeDup 算法在 FairFace 和 FACET 数据集上提供了更好的公平性指标,并保持了 CLIP benchmark 的零 - shot 性能。