BriefGPT.xyz
Ask
alpha
关键词
backdoor removal
搜索结果 - 3
仅使用少量干净样本的统一神经背门去除方法:遗忘与重新学习
ULRL 是一种全面有效的去除后门的新方法,它通过首先使用 unlearning 来识别可疑神经元,然后通过有针对性的神经权重调整来减轻后门攻击,ULRL 在消除后门同时保留模型的实用性方面显著优于现有方法。
PDF
2 months ago
因果关系基础下神经网络修复
提出了一种基于因果推理的神经网络修复技术 CARE,该技术可以有效地修复神经网络,使其满足公平性、安全性等性质,平均提高了 61.91% 的公平性,并将攻击成功率从 98% 以上降至 1% 以下。
PDF
2 years ago
ICLR
通过隐式超梯度对后门进行对抗性去学习
本文提出了使用小型的干净数据集来消除给定毒瘤模型中的后门的极小极大化公式,并提出了内隐后门对抗遗忘(I-BAU)算法来解决该问题。I-BAU 算法的性能相当且通常比最佳基线优越,尤其是对于触发器的变化,攻击设置,毒瘤比率和干净数据大小的情况
→
PDF
3 years ago
Prev
Next