Jun, 2024

通过对目标令牌进行上下文注入,增强视觉语言模型中的跨提示可转移性

TL;DR通过使用梯度方法对视觉和文本上下文进行干扰,Contextual-Injection Attack(CIA)可以将目标标记注入视觉和文本环境,从而改善目标标记的概率分布,进而增强对抗图像的跨提示可迁移性,对于视觉 - 语言模型(VLMs)中的更有效的对抗策略具有潜力。