May, 2018

CNN+CNN:用于图像字幕生成的卷积解码器

TL;DR本文在图像字幕生成方面,提出了一种仅利用卷积神经网络生成字幕的框架,通过并行计算,训练速度比基于LSTM的模型快3倍,同时在MSCOCO图像字幕数据集上获得了比LSTM更高的评估得分。