May, 2022
跨架构自监督视频表示学习
Cross-Architecture Self-supervised Video Representation Learning
TL;DR本文提出一种新的跨架构对比学习(CACL)框架,用于自监督视频表示学习,使用3D CNN和视频变换器并行生成对比学习中多样化的正对,同时引入了一个具有明确视频序列编辑距离预测能力的时间自监督学习模块,用于学习强大的时序性表示,在UCF101和HMDB51数据集上表现卓越,超越VideoMoCo和MoCo + BE等现有技术。