Sep, 2017

探究视觉问答中人类注意力监督

TL;DR本研究主要针对如何将注意力监督应用于基于 Attention 机制的视觉问答任务中,提出人类注意力网络(HAN)来生成类似于人类的注意力图,并将其应用于 VQA v2.0 数据集中。实验结果表明,该方法能够产生更准确的注意力机制和更好的性能。