ICCVMar, 2021
时空作物与关注机制:改善跨模态视频表示学习
Space-Time Crop & Attend: Improving Cross-modal Video Representation Learning
Mandela Patrick, Yuki M. Asano, Bernie Huang, Ishan Misra, Florian Metze...
TL;DR本文提出了一种基于特征裁剪和注意力机制的视频自监督学习方法 STiCA,改进了当前视频自监督学习方法中对于空间维度数据增强的应用以及特征融合方式,取得了多项数据集上的最优结果。