Jul, 2022

标题:标题值得 1000 张图片?控制学习的研究

TL;DR通过比较图像和语言数据的传输表现,研究证明,当预训练数据集足够大而又包含了低变异性的描述性标题时,对于分类任务来说,仅使用图像的方法不能与 CLIP 的传输性能相匹配。