Mar, 2016

生成关于图像的自然问题

TL;DR探索了关于一张图片是如何引发常识推理和抽象事件的问题,提出了一项新颖任务视觉问题生成(VQG),该系统的任务是在展示了一张图片后提出自然而引人入胜的问题,我们提供了三个数据集,涵盖了从目标为中心到事件为中心的各种图像,其中训练数据远比现有最先进的字幕系统提供的数据更抽象,通过训练和测试几种生成和检索模型来解决VQG这个任务,评估结果表明,尽管这样的模型为各种图像提出了合理的问题,但与人类性能的差距仍然很大,这激发了我们进一步探索将图像与常识和语用知识联系起来的相关研究。