Aug, 2024

具有模型变化鲁棒性概率保证的反事实解释

TL;DR本研究解决了现有反事实解释(CFE)在面对模型变化时失效的问题。提出了一种新颖的方法,通过理论框架定义鲁棒性,确保CFE在任何模型和变化类型上的概率保证,并通过BetaRCE方法增强了解释质量。实验表明,BetaRCE生成的反事实解释在鲁棒性和 plausibility 上均优于基线方法。