Nov, 2015

基于显式知识的视觉问答推理

TL;DR使用来自大规模知识库的信息来推理图片内容,解释推理过程并回答自然语言问题的视觉问答方法,比主流的长短时记忆方法更能回答复杂问题且表现明显更好,同时提供了数据集和协议来评估这类方法。