Mar, 2021

SelfExplain: 一种用于神经文本分类器的自说明体系结构

TL;DRSelfExplain 是一种新型的自解释模型,通过基于短语的概念解释文本分类器的预测,在不降低性能的同时增加可解释性,实验结果表明 SelfExplain 的解释能力足以促进模型的置信度。