Jul, 2018

基于自适应学习和注意力机制的风格化图像字幕生成:客观描述或情感表现?

TL;DR本文提出了一种新颖的基于style-factual LSTM和自适应学习的图像标注模型,能够同时考虑图像的内容和特定的风格要求,如幽默,浪漫,正面和负面。实验结果表明,该模型在两个不同的图像标注数据集上(幽默/浪漫标注以及正面/负面标注)的表现均超过了目前的最先进方法,且不需要额外的监督信息。