AAAIMay, 2023

通过潜在时间导航进行自监督视频表示学习

TL;DR本文提出了一种时间参数对比学习策略 Latent Time Navigation (LTN),以捕捉细微的运动,从而增强视频表示学习模型中时间感知特性,使模型在 fine-grained 和面向人类的任务中的分类性能得到了显著提高。同时,在预训练于 Kinetics-400 数据集的基础上,该模型在 UCF101 和 HMDB51 数据集上也取得了 state-of-the-art 的行动识别性能。