Oct, 2024
DISCERN:解码文本分类器中的系统性错误
DISCERN: Decoding Systematic Errors in Natural Language for Text
Classifiers
TL;DR本研究解决了机器学习文本分类器中的系统性偏见问题,这些偏见源于标注伪影或数据集中的某些类别支持不足。论文提出了DISCERN框架,通过语言解释迭代生成关于系统性错误的精准描述,这一方法显著提升了分类器的性能,并提高用户对系统性偏见的理解。最终结果显示,用户在理解偏见方面的效率和效果都有显著提高。