Nov, 2022

在部分注释的命名实体识别语料库上微调 BERT 模型

TL;DR本文提出一种基于 BERT 和自监督学习、标签预处理来优化部分标记数据集上的命名实体识别 (NER) 模型的方法。我们的方法在处理缺乏标记的数据集时显著优于基于 LSTM 的标签预处理基线,并证明在 CoNLL 2003 数据集上使用 RoBERTa 模型只标记 10%的实体即可达到与 50%实体标记的基线模型相同的性能。