文本到图像模型中的性别呈现差异审计

Feb, 2023

文本到图像模型中的性别呈现差异审计

Auditing Gender Presentation Differences in Text-to-Image Models

Yanzhe Zhang, Lu Jiang, Greg Turk, Diyi Yang

TL;DR本文提出了一种利用细粒度的自我表达属性研究文本到图像模型中不同性别呈现的范式（称为 Gender Presentation Differences 或 GPD），并通过人工注释量化性别指示符在输入文本中的频率差异并引入了一种新颖的指标：GEP，同时我们还提出了一种自动估计这种差异的方法。自动 GEP 指标基于我们的方法得出的相关性比基于现有 CLIP 得分的相关性更高，无论对于三个最先进的文本到图像模型如何一致，最后，在职业性别成见的背景下，我们展示了我们度量的普遍适用性。

Abstract

text-to-image models, which can generate high-quality images based on textual input, have recently enabled various content-creation tools. Despite significantly affecting a wide range of downstream applications, the distributions of these generated images are still not fully understood

text-to-image models gender presentation differences gep metric stereotypical attributes occupational gender stereotypes

发现论文，激发创造

利用物体检测分析文本到图像模型中的性别偏见

本研究提出了一种测量文本到图像模型中偏见的新策略，通过使用指定性别和含糊指代物体的配对提示（例如 “一个拿着物品的男人 / 女人”），我们可以检查某些物体是否与某种性别有关。

Jul, 2023

通过文本生成图像透视社交偏见

本文通过对两个流行的 T2I 模型（DALLE-v2 和 Stable Diffusion）进行广泛的自动化和人工评估实验，专注于反映出的性别、年龄、种族和地理位置之间的职业，人格特征和日常情况的生成图像，研究和量化常见的社会偏见。我们的研究结果表明，这些模型中存在严重的职业偏见和地理位置代表的日常情况。尽管可以通过增加提示本身的详细信息来缓解这些偏差，但提示缓解可能无法解决图像质量或模型在其他场景中的其他用途的差异。

Mar, 2023

自动评估指标中的性别偏见：以图像字幕为例的案例研究

本论文通过系统的调研，研究发现了预训练模型存在性别偏见的问题，探讨了预训练模型在图像字幕生成任务中的公平性影响，并提出了一种针对这种问题的解决方案：结合 n-gram 匹配和预训练模型评估度量，以减少性别偏见的影响。

May, 2023

文本到图像生成中的偏见调查：定义、评估和缓解

通过对 T2I（Text-to-Image）生成模型中的偏见进行研究调查，揭示了存在的社会偏见对少数群体的边缘化造成的影响，并指出在研究中存在的限制和未来的研究方向。

Apr, 2024

文本图像生成模型的质量、偏差和性能分析

通过 qualitatively 评估精确生成人脸、群体和指定数量对象的图片，我们不仅检查了多个文本到图像模型的性能，还进行了社会偏见分析。我们发现，容量更大的模型生成的图片质量更高，但同时这些模型也存在固有的性别或社会偏见，从而更全面地了解了它们的影响和局限性。

Jun, 2024

推动文本到图像模型评估中的地理包容性

通过进行大规模的跨文化研究，我们发现不同地理位置的人对地理表达、视觉吸引力和一致性的偏好存在显著差异，并且目前常用的自动评估指标不能充分考虑这种多样性。我们建议改进自动和人工评估方法。

May, 2024

评估文本与图像生成模型：人类图像合成的实证研究

我们在本文中提出了一种经验研究，介绍了一种用于文本到图像（T2I）生成模型的细致评估框架，应用于人类图像合成。我们的框架将评估分为两个不同的组别：第一组主要关注美学和真实性等图像质量，第二组则检验文本条件，包括概念覆盖和公平性。我们引入了一种创新的美学评分预测模型，评估生成图像的视觉吸引力，并首次提供了标记有生成人类图像低质量区域的数据集以便进行自动缺陷检测。我们对概念覆盖的探索考察了模型准确解释和渲染基于文本的概念的有效性，而公平性分析则揭示了模型输出中的偏见，特别关注性别、种族和年龄。尽管我们的研究以人类图像为基础，但这种双重面向的方法被设计成具有灵活性，可以应用于其他形式的图像生成，增强我们对生成模型的理解，并为下一代更复杂、具有上下文意识和伦理关注的生成模型铺平道路。我们将很快发布我们的代码，用于评估生成模型的数据以及标注有有缺陷区域的数据集。

Mar, 2024

缓解文本到图像生成系统中的刻板偏见

本研究提出了一种总结生成文本到图像模型中的社会偏见并确保结果在不同人群之间公平的方法。我们通过在多样的文本提示下，用由各种民族、性别、职业、年龄组等组合构建的感知肤色和性别差异的合成数据对文本到图像模型进行微调，从而减轻了这种偏见。相较于基准模型，我们的多样性微调模型在感知肤色和性别方面将群体公平指标分别提高了 150% 和 97.7%。该模型生成具有感知肤色较暗和更多女性的生成图像。为推动开放研究，我们将公开发布所有文本提示和生成训练图像的代码。

Oct, 2023

笑脸女性下降：审计图像生成 AI 中的代表性和呈现性性别偏见

本研究分析了 15,300 个 DALL-E 2 图像，发现其在男性主导领域中低估女性，而在女性主导领域中高估女性，同时揭示了这些图像中的性别偏见，需要采取女性主义干预手段以防止这些带有偏见的 AI 生成图片反馈到媒体生态环境中。

May, 2023

稳定的暴露扩散：从提示到图像的性别偏见

该研究通过引入一个评估协议，旨在自动分析性别指示对稳定扩散图像的影响，从而为生成模型中的偏见和性别失衡问题做出贡献。研究发现性别指示不仅影响性别呈现，还影响生成图像中的物体和布局的表现，揭示出稳定扩散中微妙的性别偏见。

Dec, 2023