Sep, 2024

MuAP:缺失模态的视觉语言模型的多步骤自适应提示学习

TL;DR该研究解决了现有视觉语言模型在缺失模态下的不足,提出了一种新颖的多步骤自适应提示学习(MuAP)框架,旨在生成多模态提示并进行逐步调优。研究表明,该方法显著提高了模型在多个基准数据集上的表现,推动了模态间知识的有效学习。