Nov, 2019

基于多模态领域自适应的开放式视觉问答

TL;DR本文提出了一种新颖的 VQA 有监督多模态域自适应方法,通过考虑所有模态在一起以及单独处理每个单独模态来对齐源域和目标域的数据分布,以学习跨不同领域和模态的联合特征嵌入,通过在 VQA 2.0 和 VizWhiz 数据集上进行广泛实验,表明了我们所提出方法在这个具有挑战性的 VQA 域自适应设置中胜过了现有的最先进的方法。