ICCVApr, 2017

关注图像字幕模型生成的描述

TL;DR研究了人类描述场景时自底向上显著性视觉关注和物体引用之间的一致性;提出了一种以显著性为增强因素的图像标题生成模型,结果发现该模型并不明显优于传统方法,但能更好地适用于未知数据。