Jun, 2021

VIMPAC: 基于掩码预测和对比学习的视频预训练

TL;DR该研究基于预测任务以及块状掩码策略,提出一种输入处理策略及无数据扩充方法,以达到在 SSV2、Diving48 等视频理解数据集上实现最先进效果的目的,并对模型伸缩性和预训练方法进行了详细分析。