NIPSOct, 2014

迈向视觉图灵挑战

TL;DR我们总结并讨论了针对语言和视觉的理解方面的一些挑战,其中解决方案将这两种模式紧密联系起来,以实现联合学习和推理过程。我们提供了一些解决方案,并在基于室内图像的问题回答任务上展示了一些解决方案,该任务建立了视觉图灵挑战。最后,我们辩称除了现有数据集外,我们还需要依靠 “社交共识” 来创建适当的基准。