CVPRApr, 2024

探索视觉提示在多模态大型语言模型中的可转移性

TL;DR通过 Transferable Visual Prompting (TVP) 这一新方法,在只对一个模型进行训练的情况下,有效改善多样化的 Multimodal Large Language Models (MLLMs) 的性能,以提高其在下游任务中的应用能力。