AAAIDec, 2023

不再取巧:实现时间自监督的潜力

TL;DR我们提出了更具挑战性的帧级自我监督任务和有效的增强策略,通过增加 Transformer 模型来训练从对比学习中预训练的单帧视频表示,大幅提升了通过时间自我监督学习到的特征的质量,并且在高水平语义任务和低水平时序任务上表现出卓越的性能。