Aug, 2020

视频表示学习的自监督时序判别学习

TL;DR本研究提出一种新的基于视频的自监督学习框架 VTDL,通过增加时间三元组数据的容量来增强时间特征表示的能力,并使用 Temporal Consistent Augmentation(TCA)设计器进行时间信息测量。该方法在动作识别任务中具有显著优势,并且在使用小规模视频数据集进行预训练时,该自监督方法优于完全监督方法。