CVPRJun, 2016

使用多样物体标注的图片字幕生成

TL;DR本文提出了 Novel Object Captioner (NOC) 模型,利用外部数据源和语义嵌入使模型适用于不在现有图像字幕数据集中出现的数百种物体分类,并表现出对现有罕见分类的能力,自动评估和人类判断均表明,该模型在描述物体方面比之前的工作表现更好。