ICCVMay, 2015

问你神经元:基于神经网络的图像问答系统

TL;DR利用图像表示和自然语言处理的最新进展,我们提出了一种端到端形式的 Neural-Image-QA 解决方案来回答真实世界图像上的问题,我们面临一个多模态问题,其中语言输出(答案)是基于视觉和自然语言输入(图像和问题)的,我们的方法可以使已有研究成果的表现效果成倍增加,并提供了关于该问题的额外见解,包括研究人类共识的两个新指标并扩展了初始数据集到 DAQUAR-Consensus。