Dec, 2017

不要仅仅猜测;观察并回答:克服视觉问答的先验知识

TL;DR本文提出了一个新的 VQA 模型,其中通过引入不同的先验分布来防止模型仅仅依赖训练数据中的先验信息。该模型是 GVQA,与现有 VQA 模型相比,它具有更好的泛化性能和可解释性能。