BriefGPT.xyz
Ask
alpha
关键词
neural backdoors
搜索结果 - 2
仅使用少量干净样本的统一神经背门去除方法:遗忘与重新学习
ULRL 是一种全面有效的去除后门的新方法,它通过首先使用 unlearning 来识别可疑神经元,然后通过有针对性的神经权重调整来减轻后门攻击,ULRL 在消除后门同时保留模型的实用性方面显著优于现有方法。
PDF
2 months ago
通过对抗性权重掩码进行单次神经后门消除
本研究提出 Adversarial Weight Masking(AWM)方法解决神经后门威胁,通过对训练数据注入触发数据样本,对敏感权重做 (软) 屏蔽,实验结果表明该方法优于现有技术提升了神经后门清除效果。
PDF
2 years ago
Prev
Next