Mar, 2018

逆向视觉问答: 一个新的基准和 VQA 诊断工具

TL;DR本篇文章提出了iVQA问题,利用变分模型来生成多样化、语法正确、与答案相关性较强的问题,并将其作为一种新型的视觉-语言理解基准测试。同时,还提出了使用强化学习框架来诊断现有VQA模型,揭示其内在缺陷的方法。