Nov, 2016

使用转移语义属性的视频字幕生成

TL;DR本文提出了一种深层网络模型 LSTM-TSA,加入转移学习的思想,利用从图像和视频中学到的语义属性帮助视频描述生成,在三个公共数据集上的结果超过了现有方法。