Aug, 2022

数据集设计与 CLIP 鲁棒性之间的交互作用:质量胜过数量

TL;DR探究六种公开数据来源 ——YFCC、LAION、Conceptual Captions、WIT、RedCaps、Shutterstock—— 对 CLIP 进行预训练的分布移位是否会对性能产生影响,发现不同的预训练数据表现相差很大,并且多个数据源的组合并不一定产生更好的模型,提出从理论和实践两方面着手进行数据集设计以实现稳健一般化训练的需求。