Oct, 2024

缺失模态的视觉识别深度相关提示

TL;DR本研究针对大规模多模态模型在缺失模态情况下性能下降的问题,通过提示学习方法,提出了一种将不同缺失情形视作不同输入的新策略。研究显示,通过挖掘提示与输入特征之间的相关性,并结合多模态的互补语义,可以有效提升模型在缺失模态场景下的表现,实验结果表明该方法在多个数据集上优于现有技术。