Apr, 2024
探索未学习的扩散模型:可转移的对抗攻击视角
Probing Unlearned Diffusion Models: A Transferable Adversarial Attack Perspective
Xiaoxuan Han, Songlin Yang, Wei Wang, Yang Li, Jing Dong
TL;DR針對高級文字到圖像擴散模型在身份隱私侵犯、版權侵犯和不宜上班的內容生成方面引起的安全問題,本文旨在利用對抗攻擊的可轉移性來探測黑盒情景下的不學習強健性。