Jul, 2023

揭示解释性深度学习系统中的漏洞:使用高效查询的黑盒攻击

TL;DR我们提出了一种基于微生物遗传算法的黑盒攻击方法,用于攻击解释性深度学习系统(IDLSes),该方法不需要目标模型和解释模型的先验知识,且通过结合基于转移和基于分数的方法,攻击成功率高,难以被人类分析人员检测,突出了 IDLS 安全性的提升需求。