Jan, 2020

一种正式的可解释性方法

TL;DR本论文研究了解释生成函数和学习模型的中间表示之间的联系,发现如果一个给定层的激活与解释一致,则所有后续层也一致,并研究了交集和并集作为构建新解释的一种方法。