KDDApr, 2023

可解释性是一种安全性:基于解释器的集成方法用于对抗性防御

TL;DR本文提出了 X-Ensemble 模型,采取基于梯度敏感度分析的 DNN 解释器并加以应用于混合攻击检测和修正。使用随机森林模型将多个子探测器组合到一起,以强化对对抗混合攻击的检测。在多种攻击类型和不同场景的实验中,证明了 X-Ensemble 比竞争基线方法更具优势。