CVPRDec, 2022

优化过的 CLIP 模型是高效的视频学习器

TL;DR论文提出了一种用于显式建模时间序列的新型模块,通过视频精调 CLIP 模型,可以将图像级别的表示有效地转移到视频领域,取得了良好的实验效果。