ACLDec, 2020

WeaQA: 通过标题的弱监督使视觉问答更准确

TL;DR研究如何使用图像和相关描述文本生成合成的 Q-A 对集合,而无需人工标注,同时利用空间金字塔图像块作为一种简单而有效的 VQA 模型替代方案。