EMNLPMar, 2021

模型可解释性的对照解释

TL;DR该研究提出了一种利用潜空间对分类模型进行对比解释的方法,可以对输入的文本进行高、低级别的概念和属性归纳分析,以实现更准确、细粒度的模型可解释性。