Dec, 2018

大规模的新物体字幕生成

TL;DR研究了如何从其他数据源中学习视觉概念,并创建了一个大规模的基准来评估新图像说明模型可以从中获得这些视觉概念的能力。