Feb, 2024

视觉语言模型中有害标签关联的偏见

TL;DR尽管基础视觉语言模型的性能出色,但文本和图像的共享表示空间也可能编码有害的标签关联,对公平性产生不利影响。本研究通过对最近发布的包含超过70,000个视频的“Casual Conversations”数据集进行调查,发现视觉语言模型在年龄、性别、肤色和装饰品等方面的有害标签关联频率存在偏差。我们发现,较暗肤色的个体更有可能被视觉语言模型误分类,并且发现随着变压器编码器模型规模的增加,对有害预测的置信度也增加。最后,我们发现在标准视觉任务上的改进并不能解决有害标签关联的不平等问题。