Mar, 2023

TrojDiff:针对多样化目标的扩散模型的木马攻击

TL;DR本文旨在探讨扰动模型在潜在的训练数据操纵下的脆弱性,提出了一种有效的 Trojan 攻击模型 TrojDiff,通过Trojan扩散和生成过程的优化对抗攻击,包括把对抗目标扩散到一个有偏高斯分布中、提出新的参数化的 Trojan 生成功能等,演示了在 CIFAR-10 和 CelebA 数据集上对 DDPM 和 DDIM 扰动模型执行不同类型的 Trojan 攻击的表现。