May, 2024

通过多模态提示检索学习真假标签

TL;DR我们提出了一个新的弱监督标签设置,即真假标签(TFLs),通过预训练的视觉语言模型(VLMs)生成的 TFLs 可以实现高准确性。我们理论上推导了一种风险一致估计器,以探索和利用 TFLs 的条件概率分布信息。此外,我们提出了一种基于卷积的多模态提示检索(MRP)方法,以弥合 VLMs 的知识与目标学习任务之间的差距。实验结果证明了所提出的 TFL 设置和 MRP 学习方法的有效性。