Jan, 2024

通过有针对性的攻击揭示稳定扩散中的漏洞

TL;DR本研究针对Stable Diffusion模型的脆弱性,提出一种生成特定图像的对抗性提示框架,并通过揭示导致模型脆弱性的机制来证明方法的有效性。