Apr, 2023

视觉-语言模型的黑盒少样本适应

TL;DR本文提出了一种黑盒方法Linear Feature Alignment(LFA)实现预处理图像和文字特征对齐,无需访问模型权重、训练速度快、可用于有监督和无监督训练,甚至可以用于对齐单模型计算出的图像和文本特征。在11个图像和2个视频数据集上进行的广泛实验表明,我们的方法甚至可以超过软提示学习方法。