EMNLPOct, 2022

面向强健的视觉问答:通过对比学习充分利用偏倚样本

TL;DR提出了一个名为 MMBS 的对比学习方法,通过去除与偏见相关的信息构建正样本进行训练,从而构建更加鲁棒的视觉问答模型并增加其对理性推理的贡献,同时在 VQA-CP v2 OOD 数据集上取得了竞争性的表现以及在 VQA v2 ID 数据集上保持了鲁棒的性能。