模型无关性别去偏见图像描述

CVPRApr, 2023

Model-Agnostic Gender Debiased Image Captioning

Yusuke Hirota, Yuta Nakashima, Noa Garcia

TL;DR本文提出名为 LIBRA 的框架，通过学习从合成有偏差的样本中减少性别偏见，从而降低图像字幕模型中的两种性别偏见类型：利用上下文以预测性别的偏见以及因性别导致生成某些（通常是刻板印象的）词语的概率的偏见。

Abstract

image captioning models are known to perpetuate and amplify harmful societal bias in the training set. In this work, we aim to mitigate such gender bias in →

image captioning gender bias stereotypical words mitigation libra

发现论文，激发创造

揭示和纠正图像字幕数据集和模型中的性别偏见

本文研究了 COCO 图像描述数据集中的性别偏见对训练模型的影响以及如何通过解耦图像描述和性别分类的方法来消除偏见。

Dec, 2019

女性也滑雪板：克服标题模型中的偏见 (摘要)

本研究介绍一种称为 Equalizer 的新方法，它可以确保在场景中遮挡性别证据时具有平等的性别概率，并在存在性别证据时具有自信的预测，以减轻描述数据集中不想要的偏见的影响。此模型在描述含人物的图像时预测其性别的错误率低于以前的工作，并更接近包括女性句子和包括男性句子的语句的实际比率。

Jul, 2018

女性也滑雪板：克服字幕模型中的偏见

本文介绍一种新的 Equalizer 模型，该模型生成基于个体外貌或图像环境的性别特定字幕单词，并使用 “外貌混淆损失” 和 “自信损失” 缓解了描述数据集中不必要的偏差影响，从而实现了目标当性别信息模糊时，模型需要看人物而不是使用语境线索来制定性别特定的预测。

Mar, 2018

AI 系统公平性：缓解语言视觉模型中的性别偏见

本研究尝试减轻语言视觉模型中的性别偏见问题，通过研究现有数据集中性别偏见的影响程度，并提出一种缓解方法。

May, 2023

平衡画面：利用合成对比集去偏置视觉 - 语言数据集

通过提出一个新颖的数据处理流程来纠正常用公平度量工具 (Bias@K) 存在偏见且不精确的问题。该流程通过提供一组性别平衡的对比集来扩充 COCO Captions 数据集，我们基于此数据集证明了在多个基于 CLIP 的模型中偏差的存在，表明了性别与图像背景之间毫无意义的相关性。最终，我们基于这些结果证明了我们的方法可以提高 Bias@K 的可靠度，从而对相关社会科学进行更准确的预测。

May, 2023

自动评估指标中的性别偏见：以图像字幕为例的案例研究

本论文通过系统的调研，研究发现了预训练模型存在性别偏见的问题，探讨了预训练模型在图像字幕生成任务中的公平性影响，并提出了一种针对这种问题的解决方案：结合 n-gram 匹配和预训练模型评估度量，以减少性别偏见的影响。

May, 2023

图像字幕中社会偏见放大的量化

本文提供了对图像字幕社会偏见放大的研究，通过对传统和现代图像字幕模型的评估和对每个指标的优缺点进行了全面的研究，提出了用于研究字幕偏见放大的 LIC 度量标准，并发现仅关注受保护属性预测的偏见缓解模型意外放大了偏见。

Mar, 2022

减少辱骂语言检测中的性别偏见

本文研究滥用语言检测模型的偏见问题，通过使用不同的滥用语言数据集和预训练词嵌入和模型架构，分析性别偏见并尝试了三种减轻偏见的方法：去偏向词嵌入、性别交换数据扩充以及使用更大的语料库进行微调。这些方法有效的降低了性别偏见 90-98%，并且可以扩展到解决其他情况下的偏见问题。

Aug, 2018

Men Also Like Shopping: 使用语料库级别的限制来减少性别偏见放大

通过 Lagrange 弛度算法，该研究加入语料库级别的限制条件来解决多标签物体分类和视觉语义角色标记中出现的性别偏见问题，成功地将性别偏见幅度下降了 47.5％和 40.5％，而识别任务的性能损失却很小。

Jul, 2017

识别和减少单词级语言模型中的性别偏见

本研究以性别为例，用度量方法描述了文本语料中的社会问题偏差。提出了语言模型的正则化损失项以减少性别偏差，最终在多个语料库中验证了该方法的有效性。

Apr, 2019