文本特征化工具包

Oct, 2022

Text Characterization Toolkit

Daniel Simig, Tianlu Wang, Verna Dankers, Peter Henderson, Khuyagbaatar Batsuren...

TL;DR本研究讨论了NLP模型性能评估中存在的偏向、伪相关以及假象等因素，并提出了使用Text Characterization Toolkit这一工具进行更深层次的结果分析和性质研究的方法。使用这一工具，可以预测难以处理的样本，识别数据集中潜在的（有害的）偏向和启发式方法。

Abstract

In nlp, models are usually evaluated by reporting single-number performance scores on a number of readily available benchmarks, without much deeper analysis. Here, we argue that - especially given the well-known fact that benchmarks often contain →