Nov, 2018

StNet:行动识别的局部和全局空时建模

TL;DR本文提出了一种新的空时网络(StNet)架构来进行局部和全局的空时建模,通过将N个连续的视频帧堆叠成一个超级图像,并对超级图像应用二维卷积来捕获局部空时关系,再对局部空时特征映射应用时间卷积来建模全局空时关系,该方法在动作识别方面优于现有技术,也在模型复杂度和准确度之间取得了理想的平衡,实验结果表明该方法可以广泛应用于视频表示的学习。