Aug, 2024

双原型对齐:无监督适应视觉语言模型

TL;DR本研究解决了视觉语言模型在无监督领域适应中的挑战,尤其是在缺乏标签数据时的适应性。提出的双原型对齐(DPA)方法通过引入双原型的概念,构建准确的伪标签,进而通过对伪标签的排名促进稳健的自我训练,从而显著提高了模型的适应性能。实验结果表明,DPA在13个下游视觉任务上显著优于零-shot CLIP及最新的无监督适应基线。