Mar, 2021
SelfExplain: 一种用于神经文本分类器的自说明体系结构
SelfExplain: A Self-Explaining Architecture for Neural Text Classifiers
Dheeraj Rajagopal, Vidhisha Balachandran, Eduard Hovy, Yulia Tsvetkov
TL;DRSelfExplain 是一种新型的自解释模型,通过基于短语的概念解释文本分类器的预测,在不降低性能的同时增加可解释性,实验结果表明 SelfExplain 的解释能力足以促进模型的置信度。