Sep, 2024

无数据收集的遮蔽视频建模

TL;DR本研究解决了视频变换器预训练中面临的数据收集成本、隐私及偏见问题。通过引入伪运动生成器(PMG)模块,该框架利用静态图像生成伪运动视频,进而进行遮蔽视频建模。实验结果显示,该方法有效增强了时空特征的学习,超越了现有静态图像的方法,并在一定程度上超越了使用真实和合成视频的方法。