BriefGPT.xyz
Ask
alpha
关键词
ban defense
搜索结果 - 1
BAN:检测对抗性神经元噪声激活的后门
改进了针对后门特征的逆向,将额外的神经元激活信息融入后门检测中,通过对带有后门效果的模型的损失权重进行对抗性增加来激活后门效果,从而轻松区分带有后门的模型和干净的模型。与现有的 BTI-DBF 防御相比,实验结果表明我们的 BAN 防御在
→
PDF
a month ago
Prev
Next