Apr, 2024
探索使用人类理由的文本分类器的模型性能和解释可信度之间的权衡
Exploring the Trade-off Between Model Performance and Explanation
Plausibility of Text Classifiers Using Human Rationales
TL;DR我们提出了一种方法,将人类决策的解释性文本注释引入文本分类模型,从而提高模型解释的可信度,并通过多目标优化算法在性能和可信度之间达到平衡,从而显著提高模型解释的质量。