ICLRDec, 2014

基于线性短语的简单图像描述生成器

TL;DR该文介绍了一种使用自然语言描述图像的算法,该算法结合了计算机视觉和自然语言处理。通过使用先前训练好的卷积神经网络生成的图像表示和用于描述它们的短语之间的度量,该纯双线性模型训练出能够生成描述语句的能力。同时,作者提出了一种简单的语言模型,该模型能够针对给定的测试图像生成相关的描述。实验结果表明,该方法可以在最近发布的 Microsoft COCO 数据集上获得与先进模型相当的结果,而模型极为简单。