Nov, 2021
遮蔽自编码器是可扩展的视觉学习器
Masked Autoencoders Are Scalable Vision Learners
TL;DR本文展示掩码自动编码器(MAE)是可扩展的自监督计算机视觉学习器, 通过实现以两种核心设计为基础的MAE方法:一种不对遮罩令牌进行编码的编码器和一种从潜在表示和遮罩令牌中重建原始图像的轻量级解码器,并使用更高比例的保持训练图片完整性的遮罩令牌,同时能够提高训练精度和加速计算。本方法能够训练大型高容量模型,并Transfer Learning具有出色的性能。