May, 2023
通过潜在时间导航进行自监督视频表示学习
Self-Supervised Video Representation Learning via Latent Time Navigation
TL;DR本文提出了一种时间参数对比学习策略Latent Time Navigation (LTN),以捕捉细微的运动,从而增强视频表示学习模型中时间感知特性,使模型在fine-grained和面向人类的任务中的分类性能得到了显著提高。同时,在预训练于Kinetics-400数据集的基础上,该模型在UCF101和HMDB51数据集上也取得了state-of-the-art的行动识别性能。