May, 2023

生物医学实体识别的部分注释学习

TL;DR本文探讨了应用部分标注学习方法在缺失生物医学命名实体注释的场景中进行实体识别的有效性,并提出了一个新的 TS-PubMedBERT-Partial-CRF 模型来提高实体识别性能。实验结果表明,该模型在高缺失实体比例下的 F1-score 比使用全标注学习模型 PubMedBERT Tagger 高 38%,同时其实体识别的召回率也达到了与全标注学习数据集上的上界相竞争的水平。