May, 2023

监督预训练中类内 / 类间差异的权衡

TL;DR研究了监督式预训练数据集中类内和类间多样性的权衡对模型性能的影响,并理论上证明了性能单调取决于多样性,实验应用推断出预训练数据集最佳类别 - 样本比率对模型下游任务最有效,以 ImageNet 为例,该方法模型效果提升了约 2 个点。