Feb, 2024

AICAttack: 基于注意力优化的对抗性图像描述攻击

TL;DR通过对图像进行微小扰动,本论文提出了一种名为AICAttack(基于注意力的图像字幕攻击)的新型对抗攻击策略,旨在攻击图像字幕模型。通过引入基于注意力的候选选择机制和微分进化(DE),我们的算法在黑盒攻击的场景中操作,无需访问目标模型的架构、参数或梯度信息,并通过在多个受害模型上的基准数据集上进行的大量实验证明了AICAttack的有效性,实验结果表明我们的方法在输出的单词对齐和语义方面超越了目前的领先技术。