Feb, 2023

文本到图像模型中的性别呈现差异审计

TL;DR本文提出了一种利用细粒度的自我表达属性研究文本到图像模型中不同性别呈现的范式(称为 Gender Presentation Differences 或 GPD),并通过人工注释量化性别指示符在输入文本中的频率差异并引入了一种新颖的指标:GEP,同时我们还提出了一种自动估计这种差异的方法。自动 GEP 指标基于我们的方法得出的相关性比基于现有 CLIP 得分的相关性更高,无论对于三个最先进的文本到图像模型如何一致,最后,在职业性别成见的背景下,我们展示了我们度量的普遍适用性。