Feb, 2015

不要只听,动动脑筋:利用视觉常识解决非视觉任务

TL;DR该论文探讨了图像中的视觉常识如何有助于文本任务,包括填空和视觉改写,并提出基于视觉的场景做为辅助实现对这些问题的回答,该方法表现优于基于文字的方案。