Nov, 2023

F4D: 因子化的 4D 卷积神经网络用于高效的视频级表示学习

TL;DR通过提出具有注意力的分解 4D CNN 架构,文章研究了视频级别表示学习对于捕捉和理解视频动作识别中的长程时间结构的重要性,并在五个动作识别基准数据集上验证了所提出架构的有效性。