Nov, 2023

Elijah:通过分布变化消除扩散模型中注入的后门

TL;DR我们提出了第一个扩散模型的后门检测和清除框架,通过对数百种扩散模型进行评估,实验证明我们的方法可以几乎百分之百地检测出后门,并将后门效果减少到接近零,而不明显损害模型的效用。