CVPROct, 2021

针对强鲁棒性视觉问答的反事实样本生成与训练

TL;DR介绍了一个新的模型 - 不可知模型 Counterfactual Samples Synthesizing and Training(CSST)模型,可以消除 VQA 模型的语言偏见,并使模型变得更加视觉可解释和对语言变化更敏感,并在所有 OOD 基准测试上取得了创纪录的表现。