使用分层循环神经网络进行视频段落字幕生成

Oct, 2015

使用分层循环神经网络进行视频段落字幕生成

Video Paragraph Captioning using Hierarchical Recurrent Neural Networks

Haonan Yu, Jiang Wang, Zhiheng Huang, Yi Yang, Wei Xu

TL;DR利用分层循环神经网络和时空注意力机制生成视频字幕，在YouTube和TACoS数据集上验证具有更高BLEU得分。

Abstract

We present an approach that exploits hierarchical Recurrent Neural Networks (RNNs) to tackle the video captioning problem, i.e., generating one or multiple sentences to describe a realistic video. Our hierarchical framework contains a sentence generator and a paragraph generator. The s