Oct, 2023

Split-NER:基于两个问题 - 回答分类的命名实体识别

TL;DR我们通过将 NER 问题分成两个逻辑子任务来解决,即 Span Detection 和 Span Classification,进一步将两个子任务形式化为问答问题,使用两个较为简洁的模型针对每个子任务进行优化。与 OntoNotes5.0、WNUT17 和一个网络安全数据集的基准模型相比,我们的系统 SplitNER 表现出色,并且在 BioNLP13CG 数据集上取得了相当的性能,同时与 QA 基准模型相比,训练时间显著减少。我们的系统的有效性来自对 BERT 模型进行两次微调,分别用于 span detection 和 classification。该研究代码可在给定的 https URL 上找到。