Jun, 2016

基于事实的视觉问答系统

TL;DR介绍了一种需要外部信息支持、对图像进行深层次推理的视觉问答数据集 FVQA,并在该数据集上评估了多种基线模型,提出了一种新的模型能够基于支持事实对图像进行推理。