CVPRApr, 2021

Patch Shortcuts:可解释的代理模型有效地发现黑盒漏洞

TL;DR该研究探讨了如何使用 BagNet 模型作为黑盒模型的代理,通过其内部的可解释性来检测神经网络的非语义决策,以减少机器学习模型在危险应用中存在的风险。