基于整体结构分析的嵌套命名实体识别
本文提出使用词性识别和命名实体识别相结合的方法,在 NER 中推广了语法结构树,并引入局部边际化算法来解决名字嵌套的问题。实验结果表明,使用本文提出的方法在 ACE2004,ACE2005 和 NNE 数据集上达到了现有最优效果,并在 GENIA 数据集上表现出色,并且具有快速的推理速度。
Mar, 2022
通过调查一个新的 NER 基准,我们研究了现代希伯来语中的 NER。 结果表明,显式建模形态的边界可以提高 NER 性能,而一个新的混合体系结构极大地超越了标准流水线,在这个流水线中形态分解严格先于 NER,为希伯来语 NER 和希伯来语形态分解任务设置了新的性能基准。
Jul, 2020
本文提出一种统一的框架,通过将命名实体识别任务形式化为机器阅读理解问题,能够同时处理平面 NER 和嵌套 NER 任务,并在实验中验证该框架在嵌套 NER 数据集上大幅提高性能,并在平面 NER 中获得当前最佳结果。
Oct, 2019
本文基于图形依存解析思想,利用双仿射模型对输入进行全局视图,探索所有语句中的跨度,以准确预测命名实体,以 Nested NER 为例, 对 8 个语料库进行了评估并取得了所有语料库的 SOTA 性能,最高的准确度增益高达 2.2 个百分点。
May, 2020
该论文探讨了如何更好地利用依存树传达的结构化信息来提高实体识别的性能,新提出的基于依存树指导的实体识别模型在相对较短的运行时间内表现出与传统半 - Markov 条件随机场模型同等的竞争力。
Oct, 2018
本文提出了一种基于分层上下文表示的模型,通过句子级和文档级表示来提高实体识别模型中全局信息的利用,其中包括标签嵌入和注意机制以及键值内存网络,实验证明该模型在三个基准数据集上表现出优越的效果。
Nov, 2019
我们介绍了一种基于神经网络架构的新型 NER 方法,可以对复杂语料中的嵌套结构准确地进行标注,与之前的方法不同,我们的方法采用预测实数形式的分段结构,从而能够在保持可微分性的同时,将单词和嵌套实体嵌入结合在一起。我们使用 ACE 2005 语料库对该方法进行评估,其 F1 得分为 74.6,使用上下文嵌入(BERT)可以进一步提高至 82.4,比同类数据训练上的其他方法提高近 8 F1 点。此外,我们将其与 BiLSTM-CRF 进行比较,并比较了它在简单情况下预测嵌套结构的能力对性能的影响。
Jun, 2019
提出了基于机器阅读理解(MRC)的医学命名实体识别(NER)模型,利用任务自适应预训练策略提高模型在医学领域的能力,并引入多词对嵌入和多粒度膨胀卷积以增强模型的表示能力,同时采用 Biaffine 和 MLP 的组合预测器来提高模型的识别性能。实验评估表明,我们提出的模型在中文嵌套医学 NER 的基准测试 CMeEE 上优于目前的最优模型。
Mar, 2024
自然语言处理(NLP)领域中,命名实体识别(NER)作为从非结构化文本中提取结构化洞见的关键机制,在本文中得到全面探索,融合了基础原理和当代人工智能的进展。该研究从 NER 的基本概念开始,涵盖了从传统的基于规则的策略到当代的转换器架构的一系列技术,特别是突出了 BERT 与 LSTM 和 CNN 等集成算法。该论文强调了针对金融、法律和医疗等复杂领域定制的领域特定 NER 模型,并强调了它们的专业适应性。此外,研究还涉及强化学习、创新构建(如 E-NER)以及光学字符识别(OCR)在增强 NER 能力方面的相互作用。论文以实际领域为基础,阐明了 NER 在金融和生物医学等领域中不可或缺的作用,并解决了它们所面临的独特挑战。结论部分概述了开放性挑战和路径,将这项工作标记为进入 NER 研究和应用的全面指南。
Sep, 2023
本篇论文介绍了我们参加 BioNLP Shared Tasks 2019 后在 Named Entity Recognition 和 Relation Extraction 方面的方法,我们的方法可以概括应用于不同语言的文本,包括英语和西班牙语,其中我们使用了语言特征,混合损失,多任务目标和令牌级合成策略以提高 Named Entity Recognition 的性能,使用基于字典的模糊和语义搜索来执行实体标准化, 最后,我们的 Relation Extraction 系统使用带语言特征的 Support Vector Machine,并在相关任务上表现出色。
Oct, 2019