Apr, 2024

用于克服扩散模型中概念抑制的概念算术

TL;DR通过结合多个提示进行图像生成的分散模型的构成性属性在本文中被利用,提出了对安全措施的攻击方法,并讨论了该发现对安全模型部署的影响。同时,也开启了对分散模型的概念算术和组合推理对安全机制的讨论。