一种有效的基于转移的不连续命名实体识别模型

ACLApr, 2020

一种有效的基于转移的不连续命名实体识别模型

An Effective Transition-based Model for Discontinuous NER

Xiang Dai, Sarvnaz Karimi, Ben Hachey, Cecile Paris

TL;DR提出了一种基于转换和使用通用神经编码的简单有效的模型，能够识别医学命名实体识别中存在的连续和不连续的提及，同时在三个生物医学数据集上实验表明，该模型能够有效识别不连续提及，不会牺牲连续提及的准确性。

Abstract

Unlike widely used named entity recognition (NER) data sets in generic domains, biomedical NER data sets often contain mentions consisting of discontinuous spans. Conventional sequence tagging techniques encode Markov assumptions that are efficient but preclude recovery of these mentio

named entity recognition biomedical data sets discontinuous mentions transition-based model neural encoding

发现论文，激发创造

一种基于 Span 的模型用于联合识别重叠和不连续实体

提出了一种新的基于 span 的模型，旨在准确地识别重叠和不连续的命名实体，并通过关系分类判断实体片段之间的关系。实验结果表明，这种模型在处理重叠和不连续的命名实体时具有很高的竞争力。

Jun, 2021

作为最大团探测的间断命名实体识别

本文提出了一种基于 Mac 模型的分段图算法，用于解决实体识别中异构实体的问题。该算法可将异构实体视作图中的节点，通过识别图中的最大团并连接团内的连续实体段，实现对异构实体的非参数化处理，在三个基准数据集上的结果证明该方法领先于目前的最优算法，并且速度提高了 5 倍。

Jun, 2021

一种基于神经转移的嵌套提及识别模型

本论文介绍了一种可扩展的过渡算法，用于模拟实体提及可以递归包含其他提及的嵌套结构，其在 ACE 数据集上的最新结果表明了其探测嵌套提及的有效性。

Oct, 2018

科学命名实体识别的分层 Transformer 模型

使用 BERT 和 transformer 层的简单和有效的 Named Entity Recognition 方法在计算机科学和生物医学领域的三个基准数据集上优于当前最先进技术，无需外部资源或特定数据增强。

Mar, 2022

命名实体识别的神经网络结构

本文介绍基于双向 LSTM 和条件随机场，以及基于转移的方法的两种新的神经网络模型，这些模型不依赖于领域特定的知识和语言。通过使用监督语料库和未标注语料库，字符表示和无监督的学习表示，这些模型在四种语言中实现了名词实体识别的最先进性能。

Mar, 2016

各种 NER 子任务的统一生成框架

该研究提出了一种基于序列到序列的统一框架实现实体识别子任务的方法，既不需要特定的标记模式和枚举语法，也能够同时解决平面、嵌套和不连续型 NER 任务，通过使用三种实体表示方法，实现了出色的表现。

Jun, 2021

具有关系关注和类型关注的多任务 Transformer 用于命名实体识别

本文提出一种多任务 Transformer 模型，该模型将实体边界检测任务整合到命名实体识别任务中，通过关系分类来实现实体边界检测，并采用外部知识库和自注意力及交叉注意力机制来提高解码时实体类型映射的准确性。在多个实验数据集上的实验结果表明，该方法显著提高了生成型 NER 模型的性能。

Mar, 2023

计算上高效的命名实体识别标注器的受限解码

通过对输出进行限制，可以训练出一个标注器，其与 CRF 相比可以实现两倍的交叉熵损失速度，差异在 F1 方面不具有统计学意义，从而有效消除了对 CRF 的需要。

Oct, 2020

通过多粒度嵌入和增强标注进行多级生物医学命名实体识别

本文提出了一种集成多种模型的混合方法，以解决生物医学实体识别中的局限性，并在 i2b2/2010 数据集上评估，得到了 90.11 的 F1 分数。

Dec, 2023

大规模生物医学命名实体识别

通过在 Apache Spark 之上重新实现 Bi-LSTM-CNN-Char 深度学习架构，我们提出了一个单可训练的命名实体识别（NER）模型，该模型在七个公共生物医学基准测试中获得了新的最优结果，而不使用像 BERT 这样的重型上下文嵌入。该模型在生产级别代码库中作为开源 Spark NLP 库的一部分免费提供，并且可以扩展以支持其他人类语言，而不需要更改代码。

Nov, 2020