Nov, 2023
通过可解释的标记模式理解和减轻分类错误
Understanding and Mitigating Classification Errors Through Interpretable Token Patterns
Michael A. Hedderich, Jonas Fischer, Dietrich Klakow, Jilles Vreeken
TL;DR我们提出了一种方法,通过发现那些区分正确和错误预测的标记模式来获得全局且可解释的描述,从而改善 NLP 分类器的性能。通过一系列实验证明,我们的方法在实践中表现良好,能够在大词汇量的不平衡数据上恢复出真实情况,并对 NLP 分类器的系统错误提供明确可行的见解。