CVPRNov, 2015

生成和理解明确的物体描述

TL;DR本文提出了一种生成图像中特定物体或区域(即指代表达)的明确描述并理解或推断所描述的物体的方法。实验表明,该方法优于之前没有考虑场景中其他潜在歧义对象而生成对象描述的方法。作者基于深度学习方法取得的最近成功,灵感提出了该方法。作者提供了一个基于 MS-COCO 的新的大规模指代表达数据集,并发布了数据集和可视化和评估工具箱。