Dec, 2021

自监督视频表示的对比时空预训练学习

TL;DR本文提出了一种新的预训练任务方案,即基于空时重叠率 (STOR) 预测,旨在通过判断生成样本之间的 STOR 来学习视频自监督表示学习,并结合对比学习和预训练任务进行联合优化,从而进一步提高视频理解的空时表示学习。