Nov, 2015

深入探究卷积网络用于学习视频表示

TL;DR使用门控循环单元递归网络学习视频的感知特征,从深度卷积网络的各个层级提取感知特征,包括高级和低级特征,结合前者的特殊信息和后者的空间信息,使用改进的GRU模型控制模型参数的数量,并在人类动作识别和视频字幕生成任务中证明其有效性。