May, 2022
数据决定对比语言图像预训练(CLIP)中的分布鲁棒性
Data Determines Distributional Robustness in Contrastive Language Image
Pre-training (CLIP)
TL;DR通过实验研究,我们发现对比训练语言-图像模型的鲁棒性提高的主要因素是训练分布的多样性,而其他因素对鲁棒性几乎没有贡献。除了我们的实验结果,我们还介绍了ImageNet-Captions,这是带有来自Flickr的原始文本注释的ImageNet版本,以进一步进行语言-图像训练的受控实验。