CVPRJul, 2020
人类动作识别的深度时空 STFT 卷积神经网络
Depthwise Spatio-Temporal STFT Convolutional Neural Networks for Human Action Recognition
Sudhakar Kumawat, Manisha Verma, Yuta Nakashima, Shanmuganathan Raman
TL;DR使用 STFT 块替代 3D 卷积层及其变种可以提高 3D CNN 的特征学习能力,显著减少其参数和计算复杂度,并在七个动作识别数据集上达到甚至超过现有方法的性能。