Jun, 2016

视觉问答中的人类关注:人类和深度神经网络是否看同一区域?

TL;DR我们通过设计游戏化的注意力注释接口,在Visual Question Answering(VQA)中对人类注意力进行了大规模研究,为此引入了VQA-HAT数据集,在定性和定量方面评估VQA模型生成的注意力信息与人类注意力的相似性。研究结果表明,当前的VQA注意力模型似乎没有关注与人类注意力相同的区域。