MMApr, 2016

使用深度双向 LSTM 进行图像字幕生成

TL;DR本研究提出了一种端到端可训练的深度双向 LSTM 模型,用于图像字幕生成,增加了数据增强技术,并在三个基准数据集上进行了评估,证明其性能竞争力强。