Feb, 2020

使用时序挤压池化学习时空表示

TL;DR本文提出了一种新的视频表示学习方法,即 Temporal Squeeze(TS)池化,该方法可以从长序列的视频帧中提取必要的移动信息,并将其映射成一组少量的图像。将 Temporal Squeeze pooling 作为层嵌入到现有的卷积神经网络中,设计了一种新的视频分类模型,称为 Temporal Squeeze Network(TeSNet)。生成的 Squeezed Images 包含视频帧中的必要移动信息,与视频分类任务的优化相对应。我们在两个视频分类基准测试上评估了我们的体系结构,并将结果与最先进的结果进行了比较。