AAAIDec, 2022

探索随机自回归图像建模以获取视觉表征

TL;DR本文针对自回归模型在计算机视觉领域无法与其他自监督学习方法相比的问题,通过引入随机排列策略和并行编码 - 解码训练过程,提出了一种名为 SAIM 的新型随机自回归图像建模方法,取得了极大的性能提升,特别是在基于 ImageNet-1K 数据的视觉变换任务方面达到最佳精度 83.9%。