Aug, 2023

能否达成一致?论罗生门效应与事后可解释人工智能的可靠性

TL;DR在 Rash\=omon 效应的样本集中,本研究使用 SHAP 对模型的解释进行了影响样本大小的研究。在 5 个公共数据集上的实验显示,随着样本量的增加,解释逐渐趋于一致。少于 128 个样本的解释具有很高的变异性,限制了可靠的知识提取。然而,随着数据增加,不同模型之间的一致性得到了提高,使得达成共识成为可能。集成方法通常具有更高的一致性。这些结果为信任解释提供了指导。低样本数量时的变异性意味着没有验证可能导致结论的不可靠性。还需要更多关于模型类型、数据领域和解释方法方面的研究。检验神经网络和特定模型解释方法的收敛性将具有重大的影响。所探讨的方法为从模糊模型中获取知识提供了原则性的技术。