CVPRApr, 2021
Patch Shortcuts:可解释的代理模型有效地发现黑盒漏洞
Patch Shortcuts: Interpretable Proxy Models Efficiently Find Black-Box Vulnerabilities
Julia Rosenzweig, Joachim Sicking, Sebastian Houben, Michael Mock, Maram Akila
TL;DR该研究探讨了如何使用 BagNet 模型作为黑盒模型的代理,通过其内部的可解释性来检测神经网络的非语义决策,以减少机器学习模型在危险应用中存在的风险。