Nov, 2019

LIME 和 SHAP 欺骗:对事后解释方法的对抗攻击

TL;DR本文提出一种新型的脚手架技术可以隐藏任何给定分类器的偏见,并演示了该技术如何可以欺骗常见的解释技术如 LIME 和 SHAP 生成无害的解释而不反映潜在的偏见。