Sep, 2021

基于前景背景合并的运动感知对比视频表示学习

TL;DR为解决视频自监督学习中的“背景偏差问题”,我们提出了前景-背景合并(FAME)方法,通过将选择的视频的移动前景区域合成到其他视频的静态背景中,去除背景的shortcut,让模型更专注于运动模式,从而在动作识别等任务上取得了最先进的结果。