AAAIDec, 2020

MVFNet: 高效视频识别的多视角融合网络

TL;DR本文提出了一种基于 2D CNN 骨干网络的新的多视图融合(MVF)模块,用于视频动作识别中的时空建模,并利用可分离卷积实现了高效处理,实验结果表明,该方法在不降低识别精度的情况下降低了模型复杂度。