May, 2024

统一视角:全球、群体和局部级别上的合理反事实解释

TL;DR通过梯度优化,引入了一种新的整合方法,为可区分分类模型生成本地、小组和全局反事实解释,以解决全局反事实解释所面临的挑战,并增强了可行性和可信度,从而提高了 AI 模型的可解释性和负责任性。