ICLRMar, 2024

不要以貌取人:视频识别的运动一致增强

TL;DR本研究探讨了色调变化对视频识别的影响,并提出了一种名为 Motion Coherent Augmentation(MCA)的数据增强方法,通过引入视频中的外观变化,隐式地鼓励模型优先考虑动态模式而非静态外观。我们提出了一个名为 SwapMix 的操作来高效地修改视频样本的外观,并引入了 Variation Alignment(VA)来解决 SwapMix 引起的分布偏移,强制模型学习外观不变表示。全面的实证评估验证了 MCA 的有效性和泛化能力,以及 VA 在其他增强方法中的应用。