CVPRMay, 2022

跨架构自监督视频表示学习

TL;DR本文提出一种新的跨架构对比学习(CACL)框架,用于自监督视频表示学习,使用 3D CNN 和视频变换器并行生成对比学习中多样化的正对,同时引入了一个具有明确视频序列编辑距离预测能力的时间自监督学习模块,用于学习强大的时序性表示,在 UCF101 和 HMDB51 数据集上表现卓越,超越 VideoMoCo 和 MoCo + BE 等现有技术。