Dec, 2021

面具特征预测用于自监督视觉预训练

TL;DR本研究提出了 Masked Feature Prediction (MaskFeat) 方法,它使用随机遮挡的方式自我监督预训练视频模型,主要利用 Histograms of Oriented Gradients(HOG)这种手工特征描述符,探讨了 5 种不同的特征,并发现其中 HOG 在性能和效率方面表现出色,该方法在无需使用额外模型权重或监督的情况下,使用未标记视频预训练,可以实现 86.7%的 Kinetics-400 分类准确率,拥有出色的表现。