Jun, 2024

注释错误与 NER:OntoNotes 5.0 研究

TL;DR该研究通过使用三种简单技术在 OntoNotes 5.0 语料库中检测注释错误,对英文命名实体识别(Named Entity Recognition,NER)的训练集、开发集和测试集进行了大量修正,提高了 1.23% 的整体 F 分数,对某些实体类型的改进超过 10%。这些技术可应用于其他 NER 数据集和其他序列标记任务。