Oct, 2022

文本特征化工具包

TL;DR本研究讨论了NLP模型性能评估中存在的偏向、伪相关以及假象等因素,并提出了使用Text Characterization Toolkit这一工具进行更深层次的结果分析和性质研究的方法。使用这一工具,可以预测难以处理的样本,识别数据集中潜在的(有害的)偏向和启发式方法。