May, 2024

用反事实推理发现大规模视觉 - 语言模型中的偏见

TL;DR通过对现有的大规模视觉 - 语言模型进行大规模研究,我们发现社会属性,如种族、性别和形象特征,可以显著影响生成的有害内容、能力相关词汇、有害刻板印象和被描述个体的评分,同时也探讨了大规模视觉 - 语言模型和对应的语言模型之间的社会偏见关系和减缓偏见的推理策略。