May, 2024

PureGen: 通用数据净化方法——基于生成模型动态的训练时毒素防御

TL;DR利用随机变换介绍的普遍数据净化方法,通过迭代 Langevin 动力学算法行为模型(EBMs)、去噪扩散概率模型(DDPMs)或两者的能量波动来净化被污染的数据,最小化对分类器泛化性能的影响,并在 CIFAR-10、Tiny-ImageNet 和 CINIC-10 上提供针对多种攻击(包括 Narcissus、Bullseye Polytope 和 Gradient Matching)的最新防御,而无需攻击或分类器特定信息。