May, 2024

基於後門的可解釋 AI 評估方法的高保真度評估基準

TL;DR我们提出了一个遵循可信度准则的基于后门攻击的可解释人工智能基准(BackX),并且通过使用我们的基准对现有方法进行了综合比较和评估,同时为防御后门攻击提供了指导。