May, 2023

图像引导故事结尾生成的迭代对抗攻击

TL;DR本研究提出了一种迭代的对抗攻击方法(Iterative-attack),该方法融合了图像和文本攻击,可以更有效地搜索对抗性的文本和图像,从而提高多模态文本生成模型的对抗鲁棒性。实验结果表明,该方法优于现有的单模态和非迭代多模态攻击方法,这表明可以提高多模态文本生成模型的安全性。