BriefGPT.xyz
Jul, 2022
时间至上: 为视频Transformer提供时间自监督
Time Is MattEr: Temporal Self-supervision for Video Transformers
HTML
PDF
Sukmin Yun, Jaehyung Kim, Dongyoon Han, Hwanjun Song, Jung-Woo Ha...
TL;DR
本文提出了一种面向视频任务的基于Transformer的模型,通过自监督学习并增加对视频帧之间时间轴的考虑,有效地消除了空间偏差,提升了模型对于时间动态的表征能力并实现了很好的视频分类效果。
Abstract
Understanding
temporal dynamics
of
video
is an essential aspect of learning better
video
representations. Recently,
→