Feb, 2024

重新审视远程监督的命名实体识别:一个新的基准和一种简单方法

TL;DR该研究论文探讨了在遥感监督(DS-NER)框架下的命名实体识别(NER),其中主要挑战在于由于伪阳性、伪阴性和正类型错误等固有错误导致标签质量受损。我们批判性评估了当前 DS-NER 方法的效力,使用了一个名为 QTL 的真实基准数据集,揭示其性能常常达不到预期。为了解决标签噪声的普遍问题,我们引入了一种简单而有效的方法,基于课程的正负无标记学习(CuPUL),该方法在训练过程中通过从 “简单” 且更干净的样本开始,增强模型对噪声样本的鲁棒性。我们的实证结果突出了 CuPUL 减少噪声标签影响、超越现有方法的能力。