Dec, 2022

统计数据集评估:可靠性,难度和有效性

TL;DR本论文提出了一个模型不可知的数据集评估框架,通过基于经典测试理论的统计分析,评估数据集的可靠性、难度和有效性等三个基本维度,并以命名实体识别为案例研究,介绍了 9 个统计指标用于评估数据集的质量,实验结果和人工评估验证了该框架的有效性,发现数据集质量对模型绩效有显著影响,因此在模型训练或测试前应进行数据集质量评估或针对性的数据集改进。