Aug, 2019

图像字幕反射解码网络

TL;DR该论文提出了一种名为反思解码网络(RDN)的图像字幕生成模型,在编码器-解码器框架下增强了字幕解码器中的长序列依赖和位置感知,以最大化所生成的字幕中传递的信息,并通过在视觉和文本特征上协同关注来实现图像字幕的生成。实验结果表明,使用此方法可显著提高复杂情景下的图像字幕生成效果。