Jun, 2024

药剂:走向毒物遗忘

TL;DR通过引入新的抗干扰方法和寻找适合的超参数来解决恶意攻击和毒数据从已训练模型中删除的问题,我们的方法在 CIFAR10 和 CIFAR100 数据集上检验后,毒数据去除效果显著,修复了 93.72% 的毒样本,相较于全模型重新训练方法(40.68%)和 Selective Synaptic Dampening 方法(83.41%),我们的方法降低了模型准确率丧失的程度。