backdoor defenses | BriefGPT

关键词backdoor defenses

搜索结果 - 4

BAN：检测对抗性神经元噪声激活的后门
改进了针对后门特征的逆向，将额外的神经元激活信息融入后门检测中，通过对带有后门效果的模型的损失权重进行对抗性增加来激活后门效果，从而轻松区分带有后门的模型和干净的模型。与现有的 BTI-DBF 防御相比，实验结果表明我们的 BAN 防御在
PDFa month ago
ICLR毒害伪造脸部：面向面部伪造检测的后门攻击
嵌入了后门攻击的面部伪造检测方法的新威胁以及提出的解决方案。
PDF5 months ago
BadCLIP: 多模态对比学习的双嵌入引导后门攻击
本文介绍了一种名为 oolns 的抵抗后门检测和模型优化防御的攻击，通过基于贝叶斯规则的双嵌入引导框架，在自然触发模式中实现了视觉触发模式的文本目标语义近似，并通过优化视觉触发模式与目标视觉特征的一致性对目标样本进行了污染，证明其对现有的后
PDF8 months ago
CVPR不要惊慌：FREAK 方法用于检测 DNNs 中带后门污染样本
本文研究了深度神经网络在对比干净数据样本和污染数据样本时的频率敏感性，发现两种数据样本的频率敏感性存在显著差异。利用这些发现，我们提出了一种名为 FREAK 的基于频率的污染样本检测算法，展现了其在频率后门攻击和部分空间攻击中的高效性。本研
PDFa year ago