Jul, 2022

通过对抗性权重掩码进行单次神经后门消除

TL;DR本研究提出Adversarial Weight Masking(AWM)方法解决神经后门威胁,通过对训练数据注入触发数据样本,对敏感权重做(软)屏蔽,实验结果表明该方法优于现有技术提升了神经后门清除效果。