Sep, 2023

VPA:完全测试时间的视觉提示适应

TL;DR通过引入可学习的标记,VPA(Visual Prompt Adaptation)作为一个框架通过测试时间的自适应实现了视觉提示的普遍性,且不需要源领域信息,实验结果表明 VPA 有效提高了各种模型的历程泛化、抗干扰性和领域适应能力,以及对视觉 - 语言模型的零样本识别性能的鲁棒性改进。