ACLApr, 2024

探索使用人类理由的文本分类器的模型性能和解释可信度之间的权衡

TL;DR我们提出了一种方法,将人类决策的解释性文本注释引入文本分类模型,从而提高模型解释的可信度,并通过多目标优化算法在性能和可信度之间达到平衡,从而显著提高模型解释的质量。