Feb, 2020

关于证据的一般价值和双语场景文本视觉问答

TL;DR该研究提出了一个多语言数据集,旨在解决视觉问题回答方法的泛化问题,利用基于推理的度量方法来鼓励泛化,并通过提供实验证据表明数据集的价值。