AAAIApr, 2022

视频表示学习的频率选择性增强

TL;DR本文提出了一种基于频域的时空数据增强方法,称为 FreqAug,可以在吸收视频信息的过程中减少对静态信息的偏好,以更好地学习视频表示,并在五个视频动作识别和两个时间动作定位下游任务上表现出一致的改进。