ICMLMay, 2024

UPAM:统一提示攻击文本到图像生成模型,同时针对文本过滤器和视觉检测器

TL;DR提出了一种名为 UPAM 的新颖框架,通过攻击角度研究 T2I 模型的鲁棒性,该框架旨在欺骗 T2I 模型中的文本和视觉防御机制,利用梯度优化实现更高的效果和效率,并引入了一种支持梯度优化的 Sphere-Probing Learning(SPL)方案,进一步采用 Semantic-Enhancing Learning(SEL)方案来提高 UPAM 生成目标对齐图像的效果,且具有攻击隐蔽性,通过大量实验验证了 UPAM 的有效性和效率。