Nov, 2023

SCAAT:通过关注点约束自适应对抗训练提升神经网络可解释性

TL;DR我们提出了一种名为 SCAAT 的模型无关学习方法,通过在显著性图的指导下构建对抗样本,改善了深度神经网络 (DNNs) 的可解释性,使显著性图更加精确和可靠,而不需要对模型架构进行任何修改。通过在多个 DNN 和不同图像数据集上评估生成的显著性图的质量,结果表明 SCAAT 显著提高了 DNNs 的可解释性,提供更可靠的显著性图而不损失其预测能力。