Aug, 2022
数据集设计与CLIP鲁棒性之间的交互作用:质量胜过数量
Quality Not Quantity: On the Interaction between Dataset Design and
Robustness of CLIP
TL;DR探究六种公开数据来源——YFCC、LAION、Conceptual Captions、WIT、RedCaps、Shutterstock——对CLIP进行预训练的分布移位是否会对性能产生影响,发现不同的预训练数据表现相差很大,并且多个数据源的组合并不一定产生更好的模型,提出从理论和实践两方面着手进行数据集设计以实现稳健一般化训练的需求。