ICLRMar, 2024
图像胜于千言:视觉语言模型间的提示对抗传递
An Image Is Worth 1000 Lies: Adversarial Transferability across Prompts on Vision-Language Models
Haochen Luo, Jindong Gu, Fengyuan Liu, Philip Torr
TL;DR提出了一种名为 CroPA 的方法,通过使用可学习的提示来对抗误导性的对手图片,从而显著提高了对不同提示的对手样本的传递能力。