May, 2021

Swin Transformers 自监督学习

TL;DR本文介绍了一种名为 MoBY 的自监督学习方法,使用 Vision Transformers 作为基础架构,并进行了在图像分类、目标检测和语义分割等任务中的实验验证。实验结果表明 MoBY 相对于其他基于 DeiT 的方法有更好的性能,有望推动更多 Transformer 架构的自监督学习评估。