Apr, 2024

探索视觉提示在多模态大型语言模型中的可转移性

TL;DR通过Transferable Visual Prompting (TVP)这一新方法,在只对一个模型进行训练的情况下,有效改善多样化的Multimodal Large Language Models(MLLMs)的性能,以提高其在下游任务中的应用能力。