ICMLMay, 2024

概念模型中的概念关系理解

TL;DR使用人类可以理解的概念构建解释的基于概念的可解释性方法为深度学习系统提供了洞察力。通过分析基于概念模型学习的概念表示,我们发现现有的方法缺乏稳定性和鲁棒性,无法准确捕捉概念间的关系。因此,我们提出了一种新算法,利用概念间的关系来提高概念干预的准确性,并展示了正确捕捉概念间关系如何改善后续任务。