May, 2024

利用多对多关系对抗视觉语言对抗性攻击

TL;DR通过研究视觉 - 语言模型在图像 - 文本检索中的对抗攻击,本文提出了一种利用 N:N 关系增强对抗鲁棒性的防御策略,并证明了多样化扩增技术和对齐的图像 - 文本对对提高模型的鲁棒性具有重要作用。