MMJun, 2021

机器学习逃避攻击的解释引导诊断

TL;DR本文介绍了一个新的框架,利用可解释的机器学习方法来指导高保真度评估机器学习逃避攻击,使用恶意软件和图像分类器进行综合评估,揭示了对抗样本与其上的对应扰动之间的关联差距,并展示了该方法对于评估机器学习模型鲁棒性的广泛使用。