命名实体识别的边界平滑
本文提出通过扩展词典、改善加权方法、应用动态规划算法等方式,以解决远程监督方法中词典使用的限制和提高提及边界检测性能,并在三个数据集上实验验证表明,所提出的跨度级别模型较之前的远程监督方法要更加优秀。
Dec, 2019
通过对输出进行限制,可以训练出一个标注器,其与CRF相比可以实现两倍的交叉熵损失速度,差异在F1方面不具有统计学意义,从而有效消除了对CRF的需要。
Oct, 2020
该研究采用校准置信度估计的方式来研究深度学习在实际场景下的命名实体识别问题,提出了一种基于本地和全局独立性假设的置信得分估计策略,并结合CRF模型来隔离低置信度标签,同时提出了一种基于实体标签结构的置信度校准方法,最后将其集成到自我训练框架中进行性能提升,在四种语言和遥远标注场景下的实验证明了该方法的有效性。
Apr, 2021
该研究提出两阶段标识器以识别嵌套实体,其通过过滤种子跨度和边界回归生成跨度建议,并准确地标记跨度与相应类别。实验结果表明,该方法优于以往最先进的模型。
May, 2021
本文研究了使用span prediction和sequence labeling框架进行命名实体识别的优缺点,并提出了系统组合的方法来重新识别来自不同系统的命名实体,并在11个数据集上进行了154个系统的实验,证明了span prediction也可以作为基础NER系统和系统组合器,同时也将我们的模型部署到ExplainaBoard平台上。
Jun, 2021
本研究通过绑定学习(BL)范例将序列标注和范围标注两种命名实体识别(NER)范例结合在一起,以解决此前不能同时利用两种范例优点的问题,并发现BL可显著提升NER模型的性能。
Jul, 2022
本文介绍了一种基于SpanProto和prototypical learning的few-shot NER方法,并使用margin-based loss进一步提高了模型性能。实验表明,该模型在多个基准测试中表现优异。
Oct, 2022
本文提出将生成模型和信息压缩模型结合在一起,通过信息瓶颈模型提高命名实体识别(NER)性能。通过实验证明,联合训练生成模型和信息压缩模型可以增强基线的基于span的NER系统的性能。
Feb, 2023
本文提出了一种名为DiffusionNER的算法,通过边界去噪扩散过程生成有命名实体的结果,使用这种方法可以使得DiffusionNER在实体生成过程中具有高效和灵活的能力,这种方法被应用于多个NER数据集上并取得了比之前最先进的模型甚至更好的结果。
May, 2023
命名实体识别是自然语言处理中的一项基本任务,该论文提出了一种名为边界偏移预测网络(BOPN)的新方法,通过预测候选跨度与其最近实体跨度之间的边界偏移来建立非实体跨度和实体跨度之间的联系,实现了非实体跨度作为额外正样本进行实体检测,进而将实体类型和跨度表示融合生成类型感知的边界偏移,相较之前最先进的方法,在八个广泛使用的命名实体识别数据集上取得了更好的结果。
Oct, 2023