Jul, 2022

时间至上: 为视频Transformer提供时间自监督

TL;DR本文提出了一种面向视频任务的基于Transformer的模型,通过自监督学习并增加对视频帧之间时间轴的考虑,有效地消除了空间偏差,提升了模型对于时间动态的表征能力并实现了很好的视频分类效果。