ICCVJul, 2023

用非常有限的合成图像预训练视觉 Transformer

TL;DR基于数学公式生成的合成图像的预训练方法(FDSL)通过数据增强替代了显式生成实例,证实其性能优于原始数据集,从而打开了使用更小数据集进行预训练视觉转换的新可能性。