Jan, 2022

RePre:利用重构预训练提高自监督视觉 Transformer 的性能

TL;DR本文提出了一种基于重构预训练技术 (RePre) 的自监督视觉变压器模型,使用本地特征学习来替代对图像的全局理解,其中重构预训练通过向现有对比性目标添加像素重构分支,使用变压器编码器的多层次特征进行处理,并提供了从低到高语义信息的丰富监督信息;在各种对比学习框架和不同的视觉变换器架构上,该方法带来的转移性能超过了受监督的预训练和最先进的自监督方法。