Feb, 2024

决策边界检测后门模型的 X 射线模型

TL;DR通过对决策边界进行分析,我们提出了一种针对 MLaaS 的新型后门攻击检测方法 Model X-ray,可以在不依赖于攻击假设和模型训练细节的情况下,通过对干净输入的硬预测,确定目标 API 是否受到了后门攻击,并确定目标遭受攻击的标签。广泛的实验证明,Model X-ray 可对跨不同后门攻击、数据集和架构的 MLaaS 发挥有效作用。