May, 2024
基於後門的可解釋 AI 評估方法的高保真度評估基準
Backdoor-based Explainable AI Benchmark for High Fidelity Evaluation of Attribution Methods
Peiyu Yang, Naveed Akhtar, Jiantong Jiang, Ajmal Mian
TL;DR我们提出了一个遵循可信度准则的基于后门攻击的可解释人工智能基准(BackX),并且通过使用我们的基准对现有方法进行了综合比较和评估,同时为防御后门攻击提供了指导。