EMNLPDec, 2016

受导引的基于开放词汇的图像描述生成与约束束搜索

TL;DR使用约束束搜索的方法和固定的预训练词嵌入,使得现有的深度图像描述模型能够利用图像标签器在测试阶段进行标注,从而实现新颖场景或对象的图像生成。该方法的结果表明了它在 MSCOCO 上获得了良好的表现,甚至优于采用相同标签预测的学习算法。同时,我们还证明了我们可以通过利用 ground-truth 标签来显着提高生成的 ImageNet 标题的质量。