实体界限干扰攻击命名实体识别
本研究探索和评估少样本命名实体识别模型在文本对抗攻击场景下的鲁棒性,并提出了一个由边界判别和关联净化组成的鲁棒两阶段少样本命名实体识别方法。该方法通过引入边界判别模块和净化关联模块,提高了命名实体边界检测和实体类型判别的鲁棒性,并在 Few-NERD 和 Cross-Dataset 两个包含对抗样本的少样本命名实体识别数据集上进行了综合评估,展示了其鲁棒性和优越性。
Dec, 2023
通过在命名实体识别中引入边界平滑正则化技术,将命名实体的概率分布从注释的跨度重新分配到周围的跨度,从而有效缓解了过度自信问题,改善了模型的校准性并获得更好的结果。
Apr, 2022
本报告提出了一种基于条件随机场层和双向 LSTM 层的神经网络体系结构,其中嵌入向量(Glove,BERT)的融合输入被用来增强模型的泛化能力,还引入了一个分类模型来分离句子并对弱类和强类进行优化以提高 Named Entity Recognition 任务的性能。经实验证明,该方法显著提高了弱类的表现结果,并且只使用了非常少量的数据集。
Mar, 2020
本文提出一种多任务 Transformer 模型,该模型将实体边界检测任务整合到命名实体识别任务中,通过关系分类来实现实体边界检测,并采用外部知识库和自注意力及交叉注意力机制来提高解码时实体类型映射的准确性。在多个实验数据集上的实验结果表明,该方法显著提高了生成型 NER 模型的性能。
Mar, 2023
本文基于图形依存解析思想,利用双仿射模型对输入进行全局视图,探索所有语句中的跨度,以准确预测命名实体,以 Nested NER 为例, 对 8 个语料库进行了评估并取得了所有语料库的 SOTA 性能,最高的准确度增益高达 2.2 个百分点。
May, 2020
本研究检测了命名实体识别(NER)模型在预测不确定实体类型时使用上下文信息的能力,设计了 NRB 测试集来诊断 NER 模型的名称规律偏差,并提出了一种新的模型无关训练方法来减轻这种偏差,该方法对改善 NER 模型性能有显著作用。
Jul, 2021
本研究提出了三种结构以实现多标签的命名实体识别,这三种方法是 BiLSTM n-CRF、BiLSTM-CRF-Smax-TF 和 BiLSTM n-CRF-TF。通过评估在 i2b2/VA 2010 和 i2b2 2012 共享任务数据集上的不同模型,本研究证明这些方法可以获得较高的准确性。
Aug, 2022
命名实体识别是自然语言处理中的一项基本任务,该论文提出了一种名为边界偏移预测网络(BOPN)的新方法,通过预测候选跨度与其最近实体跨度之间的边界偏移来建立非实体跨度和实体跨度之间的联系,实现了非实体跨度作为额外正样本进行实体检测,进而将实体类型和跨度表示融合生成类型感知的边界偏移,相较之前最先进的方法,在八个广泛使用的命名实体识别数据集上取得了更好的结果。
Oct, 2023
该研究提出两阶段标识器以识别嵌套实体,其通过过滤种子跨度和边界回归生成跨度建议,并准确地标记跨度与相应类别。实验结果表明,该方法优于以往最先进的模型。
May, 2021
本研究提出了一种新的生物医学命名实体识别框架 DMNER,其通过利用现有的实体表示模型 SAPBERT,将 BNER 分解为实体边界检测和生物医学实体匹配两个步骤,并表现出在不同 NER 情景下的适用性和有效性。
Jun, 2023