CVPRMar, 2021

无目标标签的多样数据集和方法的领域通用视觉问答模型

TL;DR本研究通过量化视觉问答(VQA)数据集在视觉和文本空间上的领域漂移,构建并测试不同家族的 VQA 方法(经典的两流,Transformer 和神经符号方法)的鲁棒性以及现有的领域自适应方法的适用性,并设计了一种新的跨越 VQA 领域差距的自适应方法。