Mar, 2020
利用可变的回放速度预测视频的自监督视觉学习
Self-Supervised Spatio-Temporal Representation Learning Using Variable
Playback Speed Prediction
TL;DR提出了一种无需标注数据的自我监督视觉学习方法,通过预测视频播放速度的变化来学习视频的时空视觉表示,同时运用可变播放速度下视觉外观的变化来学习整个视频的时空视觉特征,并提出了一种新的可应用于三维卷积神经网络的可靠的时间组归一化方法,最终在UCF-101和HMDB-51数据集上验证了该方法的有效性。