Nov, 2023

从木马到城墙:揭示扩散模型中的双向后门效应

TL;DR生成背门攻击可通过仅污染训练数据而无需篡改原始扩散过程,背门攻击能够对扩散模型产生双向影响,一方面损害了模型功能,另一方面还可以用于背门防御,并且背门触发率增加可以用于检测受到背门污染的训练数据,此外,研究扩散模型的背门效应对于设计反背门图像分类器也具有重要价值。