COLINGMay, 2024

CoNLL#: CoNLL-03 英文细粒度错误分析和校正测试集

TL;DR现代命名实体识别系统在更大更强大的神经模型时代中稳步提高性能。本文通过对最高性能 NER 模型的测试输出进行深入分析,并在测试集上引入新的文档级注释,对其性能进行精细评估。我们通过对错误进行分类,超越 F1 分数,解释 NER 的真实技术水平并指导未来的研究。我们回顾了之前纠正测试集各种缺陷的尝试,并引入了一个新的纠正版本 CoNLL#,解决了其系统性和最常见的错误,从而允许进行低噪声、可解释的错误分析。