Apr, 2023

RECLIP: 使用小尺寸图片训练的资源高效 CLIP

TL;DR本文介绍了一种名为 RECLIP 的方法,其最小化了用于 Contrastive Language Image Pretraining 的计算资源,实现了高效的语言监督预训练。该方法利用小图像高效地学习大规模语言监督,并在最后使用高分辨率数据进行微调,以降低训练资源要求,并展示了与现有方法相比极具竞争力的指标表现。