ICCVAug, 2019

STM: 时空和动作编码用于动作识别

TL;DR本文提出了一个基于 2D 框架的 STM 网络,利用 STM 块替换 ResNet 架构中的残差块,同时编码时空特征和动作特征,实现了高效的视频动作识别。实验证明,提出的方法在数据集 Something-Something v1&v2、Jester、Kinetics-400、UCF-101 和 HMDB-51 上性能优于其他现有方法。