ICLRMay, 2023

自我监督视觉变换器学习了什么?

TL;DR对比学习和掩模图像建模的比较研究,发现自监督视觉变换器(ViTs)在表示和下游任务性能方面具有不同的属性,可以互补,最简单的协调方法可以帮助利用这些方法的优点。