May, 2022

数据决定对比语言图像预训练(CLIP)中的分布鲁棒性

TL;DR通过实验研究,我们发现对比训练语言 - 图像模型的鲁棒性提高的主要因素是训练分布的多样性,而其他因素对鲁棒性几乎没有贡献。除了我们的实验结果,我们还介绍了 ImageNet-Captions,这是带有来自 Flickr 的原始文本注释的 ImageNet 版本,以进一步进行语言 - 图像训练的受控实验。