CVPRMay, 2021

通过跟踪视频裁剪进行无监督视觉表征学习

TL;DR本文旨在通过使用追踪作为代理任务,设计了一个 Catch-the-Patch(CtP)游戏,让 3D-CNN 模型学习图像表示,以帮助视频相关任务的完成。经过广泛实验,CtP 预训练特征与其他视频预训练方法相比具有更优异的性能。