Jul, 2018
基于自适应学习和注意力机制的风格化图像字幕生成:客观描述或情感表现?
"Factual" or "Emotional": Stylized Image Captioning with Adaptive
Learning and Attention
TL;DR本文提出了一种新颖的基于style-factual LSTM和自适应学习的图像标注模型,能够同时考虑图像的内容和特定的风格要求,如幽默,浪漫,正面和负面。实验结果表明,该模型在两个不同的图像标注数据集上(幽默/浪漫标注以及正面/负面标注)的表现均超过了目前的最先进方法,且不需要额外的监督信息。