Jul, 2023

预训练模型的几何感知自适应

TL;DR我们提出了一种简单的方法,利用标签空间的度量信息通过替换传统的预测规则中的 argmax 来适应已训练好的模型以可靠地预测新类别,或者在零样本预测中提高性能,而无需额外的训练。我们对该方法进行了全面的理论分析,研究了学习理论结果、标签空间直径、样本复杂度和模型维度之间的权衡、预测任何未观察到的类别的全部情境特征以及在不能预测所有未观察到的类别范围时获得最优训练类别的最新类别选择程序。在实证研究中,我们的方法 Loki 利用易得的外部度量指标在 ImageNet 上相对 SimCLR 可获得高达 29.7% 的相对改进,并可扩展到数十万个类别。当没有可用的度量指标时,Loki 可以使用类别嵌入的自主度量,在预训练的零样本模型(如 CLIP)上获得了 10.5% 的改进。