ICLRMar, 2024

图像胜于千言:视觉语言模型间的提示对抗传递

TL;DR提出了一种名为 CroPA 的方法,通过使用可学习的提示来对抗误导性的对手图片,从而显著提高了对不同提示的对手样本的传递能力。