BriefGPT.xyz
May, 2023
CLIP训练的反比例缩放定律
An Inverse Scaling Law for CLIP Training
HTML
PDF
Xianhang Li, Zeyu Wang, Cihang Xie
TL;DR
本文发现了CLIP训练的反比例缩放定律,即使用更大的图像/文本编码器,可以应用更短的图像/文本令牌序列进行训练,并通过减少计算障碍成功地训练CLIP,在 A100 八 GPU 服务器上,我们的 CLIP 模型在 ~2 天、~3 天和~4 天内实现了零样本 top-1 ImageNet 准确率分别为 63.2%、67.8% 和 69.3%,希望能够鼓舞更多学术领域的研究。
Abstract
clip
, the first foundation model that connects images and text, has enabled many recent breakthroughs in
computer vision
. However, its associated
→