利用领域知识进行低资源命名实体识别

Mar, 2022

利用领域知识进行低资源命名实体识别

Using Domain Knowledge for Low Resource Named Entity Recognition

Yuan Shi

TL;DR本研究提出了一种基于领域知识的命名实体识别方法，使用领域词典和标注数据来提高低资源领域中的命名实体识别效果，避免大规模数据调整的同时，在科技设备领域数据集上实现了显著的 F1 分数提升。

Abstract

In recent years, named entity recognition has always been a popular research in the field of natural language processing, while traditional deep learning methods require a large amount of labeled data for model t

named entity recognition deep learning domain knowledge low resources scientific and technological equipment

发现论文，激发创造

跨领域命名实体识别的数据增强

通过学习不同领域间的文本模式和数据特征，并为高资源领域提供低资源领域数据增强，我们提出了一种新的神经架构，可以大幅提高命名实体识别任务性能。

Sep, 2021

零资源跨领域命名实体识别

本文提出了一种跨领域命名实体识别模型，使用多任务学习和实体专家混合方法，实现了零资源领域自适应，性能优于其他无监督跨域序列标注模型。

Feb, 2020

跨语言命名实体识别的增强迭代知识蒸馏

本文描述了微软在交叉语种命名实体识别中的新实践方法，使用源语种的标注数据和目标语种的无标注数据，采用半监督学习和强化学习的方法来提取弱监督信号并实现了新的最先进性能优于现有的模型。

Jun, 2021

基于词嵌入的在线媒体命名实体识别领域自适应

本文提出了使用分布式词表示有效地将一个领域中学习的模型适应到其他领域的方法，并分析了不同领域之间的语言变异以识别可以提高性能的语言见解，提出了捕捉词汇用法的领域特定语义的方法，并演示了如何有效地使用此类领域特定知识来学习在领域适应设置中优于以前基准的 NER 模型。

Dec, 2016

FactMix: 使用少量领域内标注样本泛化到跨领域命名实体识别

本文提出了一种基于理性的两步数据增强方法来提高模型的泛化性能，用于跨域 NER 任务，结果表明我们的模型无论是在数据增强还是提示调整方法中都显著提高了交叉域 NER 任务的性能。

Aug, 2022

用于跨领域命名实体识别的神经适应层

本文研究神经网络结构在新闻信息提取任务上的应用，并针对不同领域应用的性能下降问题，提出一种轻量而有效的域适应方法，无需使用源域数据进行重新训练，在社交媒体等新兴领域中具有显著的应用价值。

Oct, 2018

低资源自然语言理解的有效迁移学习

本论文旨在解决 NLU 模型在缺乏数据或知识资源时的挑战，提出了跨语言和跨域适应方法及面向低资源语言的关键词增强方法、序列颗粒化建模方法、多领域预训练方法和粗粒度到细粒度的表示学习框架。

Aug, 2022

通过检索非结构化知识进行自适应命名实体识别

本文提出了一种自适应 NER 方法，利用未经充分学习的实体作为查询，从非结构化文本中检索外部知识，以提高模型的性能。通过实验验证，该模型在 CrossNER 数据集上表现优于强基准模型 2.35 个 F1 分数。

Oct, 2022

无标记数据下的命名实体识别：一种弱监督方法

文章提出了一种简单但有效的方法，通过弱监督机制在没有标注数据的情况下学习 NER 模型，该方法使用广泛的标注功能对目标域中的文本进行自动注释，然后通过隐马尔可夫模型将这些注释合并在一起，从而最终基于这个统一的注释训练一个序列标注模型。通过在两个英文数据集上的评估（CoNLL 2003 和来自路透社和彭博社的新闻文章），相比于域外神经 NER 模型，在实体级别的 F1 得分上取得了约 7 个百分点的提升。

Apr, 2020

基于迁移学习的新型命名实体识别

本文提出了一种命名实体识别的方法，通过在相关领域具有相似（但并非完全相同）的命名实体类型的训练数据和少量领域内训练数据的情况下，使用迁移学习来学习领域特定的命名实体模型，这种方法假设不仅领域不匹配，而且标签不匹配。

Oct, 2016