Oct, 2023

安全驱动的未学习扩散模型是否生成?对于现在来说,仍然易于生成不安全的图像

TL;DR我们提出了一种基于对抗攻击的评估框架,用于评估安全驱动的模型在消除不需要的概念、风格和对象方面的鲁棒性,证明了我们的方法在与最先进的对抗提示方法进行对比时的效果和效率。