ECCVJul, 2020

使用视觉编码器减少视觉问答中的语言偏差

TL;DR该研究提出了一种新的模型不可知的问题编码器 VGQE,它可以降低 VQA 模型对语言偏见的依赖,并提高性能。