ACLMar, 2022

通过对抗学习使用提示数组消除偏差:使视觉语言模型消除偏差

TL;DR研究表明,视觉 - 语言模型存在社会偏见和刻板印象,但由于缺乏测量鲁棒性和特征退化的挑战,因此需要通过排名指标和去偏方法来弥补这些多模式伤害,并发现将经过联合训练的对抗去偏和对比损失的学习嵌入附加在文本查询之前,可降低各种偏差度量,对图文表示的降级最小。