AAAIDec, 2021
自监督视频表示的对比时空预训练学习
Contrastive Spatio-Temporal Pretext Learning for Self-supervised Video Representation
Yujia Zhang, Lai-Man Po, Xuyuan Xu, Mengyang Liu, Yexin Wang...
TL;DR本文提出了一种新的预训练任务方案,即基于空时重叠率 (STOR) 预测,旨在通过判断生成样本之间的 STOR 来学习视频自监督表示学习,并结合对比学习和预训练任务进行联合优化,从而进一步提高视频理解的空时表示学习。