May, 2023

视觉问答中语言模态的实证研究

TL;DR本文通过一系列实验,探究语言模态对视觉问答模型在超出其学习领域的数据上的影响,提出简单的方法来减少模型对语言先验的依赖并在 out-of-distribution 测试集上提高性能。