Feb, 2024

DisDet:探索扩散模型上后门攻击的可检测性

TL;DR首次从防守者和攻击者的角度对扩散模型进行了系统研究,探索了被破坏的扩散模型中毒噪声输入的可检测性和躲避机制,并提出了基于分布差异的低成本触发器检测方法。