CVPRAug, 2022

鲁棒视觉问答的生成偏差

TL;DR采用基于生成网络、对抗性目标函数和知识蒸馏相结合的方法直接训练 VQA 模型的偏见模型,有效减轻 VQA 模型中的数据集偏差问题。