May, 2024

思考修剪在后门缓解中的作用:优化的视角

TL;DR为了解决剔除被感染深度神经网络中的后门相关神经元的问题,在现有方法的基础上,我们提出了优化神经元剪枝(ONP)方法,结合图神经网络(GNN)和强化学习(RL),通过学习图嵌入和找到适当的剪枝策略来修复后门模型。实验证明,ONP 可以在几乎没有性能降级的情况下有效剪枝由一组后门攻击植入的后门神经元,从而实现了后门缓解领域的最新最佳性能。