Feb, 2015
利用时间结构描述视频
Video Description Generation Incorporating Spatio-Temporal Features and
a Soft-Attention Mechanism
TL;DR这篇论文提出了一种基于循环神经网络和 3-D 卷积神经网络以及时间注意力机制的视频自动描述方法,并在Youtube2Text数据集上的BLEU和METEOR度量标准上超过了当前最先进的结果,并在更大更具挑战性的配对视频和自然语言描述数据集上进行了测试。