通过检索非结构化知识进行自适应命名实体识别

ACLOct, 2022

通过检索非结构化知识进行自适应命名实体识别

Self-Adaptive Named Entity Recognition by Retrieving Unstructured Knowledge

Kosuke Nishida, Naoki Yoshinaga, Kyosuke Nishida

TL;DR本文提出了一种自适应 NER 方法，利用未经充分学习的实体作为查询，从非结构化文本中检索外部知识，以提高模型的性能。通过实验验证，该模型在 CrossNER 数据集上表现优于强基准模型 2.35 个 F1 分数。

Abstract

Although named entity recognition (NER) helps us to extract domain-specific entities from text (e.g., artists in the music domain), it is costly to create a large amount of training data or a structured knowledge base to perform accurate NER in the target domain. Here, we propose

named entity recognition self-adaptive ner unstructured text knowledge retrieval crossner

发现论文，激发创造

跨语言命名实体识别的增强迭代知识蒸馏

本文描述了微软在交叉语种命名实体识别中的新实践方法，使用源语种的标注数据和目标语种的无标注数据，采用半监督学习和强化学习的方法来提取弱监督信号并实现了新的最先进性能优于现有的模型。

Jun, 2021

IXA/Cogcomp 参加 SemEval-2023 第 2 项任务：基于知识库的上下文增强的多语言命名实体识别

本文介绍了一种新的命名实体识别级联方法，它由三个步骤组成：首先在输入句子中识别候选实体，然后将每个候选实体链接到现有的知识库中，最后预测每个实体候选的细粒度类别。实验证明，外部知识库在准确分类细粒度和新兴实体方面具有重要意义，并且我们的系统在 MultiCoNER2 共享任务中表现出强大的性能，即使在使用高资源语言的知识库情况下，也能在低资源语言环境中获得良好的表现。

Apr, 2023

NERetrieve: 下一代命名实体识别与检索数据集

通过大规模语言模型，命名实体识别可以达到更精细化的实体类型识别、零样本识别和语句检索等目标，但这些目标仍然需要进一步研究和探索。

Oct, 2023

基于示例的命名实体识别

我们提出了一种新的名词实体识别方法，称为基于示例的实体识别，在缺乏数据的情况下通过受到问答启发，使用少量支持示例来识别新领域中的实体范围，与当前最先进的方法相比，该方法表现出更好的性能，特别是在使用少量支持示例时。

Aug, 2020

动态命名实体识别

本研究介绍了一项新任务：Dynamic Named Entity Recognition（DNER），提供了一个框架，以更好地利用上下文来评估算法提取实体的能力。DNER 基于两个数据集，DNER-RotoWire 和 DNER-IMDb，我们评估了基线模型并提出了与此新任务相关的问题和研究方向的实验。

Feb, 2023

基于结构最近邻学习的简单有效少样本命名实体识别

论文提出了一个基于最近邻学习和结构化推理的简单的少样本命名实体识别系统，使用一个有监督的 NER 模型在源领域上进行训练，作为特征提取器，提出了一种捕获实体标签之间标签依赖性的廉价但有效的方法，并将结构化解码与最近邻学习相结合，达到了先进的表现。该方法使得 F1 分数相对于以前基于元学习的系统提高了 6％至 16％的绝对值。

Oct, 2020

少样本命名实体识别：综合研究

本文提出了一种有效地建立识别命名实体（NER）系统的方法，基于最近的基于转换器的自我监督预训练语言模型（PLMs），并探讨了三种正交的方案来改进针对少样例情况的模型泛化能力，通过大量实验结果表明，我们的方法在少数样例学习环境中显著改善或优于基于域标记微调的 PLM 线性分类器等基线方法，同时在无训练和少样例学习环境下建立了最新的业界记录。

Dec, 2020

跨文化姓名识别

该研究旨在改进个人姓名的识别，在识别不同文化背景下的姓名方面，通过实验比较结合字符和词的输入模型与传统的 NER 模型，发现该模型表现更好且可能提高准确率。

Jan, 2024

查询短语表示来自动创建命名实体识别数据集

本研究利用短语嵌入搜索构建高覆盖率的实体词典，并利用其生成具有高覆盖率的命名实体识别（NER）数据集。通过利用字典中候选短语与目标实体类型之间的嵌入距离来减少噪声，实现了弱监督 NER 模型的改进。在 6 个 NER 基准测试中，与当前弱监督 NER 模型相比，HighGEN 表现出更为优异的性能。

Oct, 2022

命名实体识别的深度学习调查

本文基于三个维度的分类法，系统地回顾了深度学习在命名实体识别上的应用技术，并介绍了面临的挑战和未来的研究方向。

Dec, 2018