May, 2022

ConvMAE:掩码卷积与掩码自编码器相遇

TL;DR本文介绍使用ConvMAE框架对Vision Transformers进行特征预训练和Masked Auto-Encoder技术的引入,提高了其在各种视觉任务中的表现。而使用masked convolution和直接监督卷积层的features等方法,可以在保证计算效率的同时提高了分类和检测的准确率。