零资源跨领域命名实体识别

Feb, 2020

Zero-Resource Cross-Domain Named Entity Recognition

Zihan Liu, Genta Indra Winata, Pascale Fung

TL;DR本文提出了一种跨领域命名实体识别模型，使用多任务学习和实体专家混合方法，实现了零资源领域自适应，性能优于其他无监督跨域序列标注模型。

Abstract

Existing models for cross-domain named entity recognition (NER) rely on numerous unlabeled corpus or labeled NER training data in target domains. However, collecting data for low-resource target domains is not only expensive but also time-consuming. Hence, we propose a cross-domain NER

cross-domain named entity recognition multi-task learning zero-resource domain adaptation mixture of entity experts sequence labeling models

发现论文，激发创造

零资源跨语言命名实体识别

本文提出一种基于词级对抗训练、参数共享和特征增强的无监督跨语言命名实体识别模型，可在不依靠双语词典或平行数据的情况下，将命名实体知识从一种语言转移到另一种语言。通过对五种不同语言的实验表明，该模型的有效性优于现有模型，并为每个语言对设置了新的 SOTA。

Nov, 2019

基于元学习技术的极少资源跨语言命名实体识别增强模型

本文提出了一种元学习方法，通过细调源语言模型，结合相似示例中所传达的结构和语义信息来增强目标语言的命名实体识别。在五种目标语言上的实验表明，该方法显著优于现有的最先进方法。

Nov, 2019

利用领域知识进行低资源命名实体识别

本研究提出了一种基于领域知识的命名实体识别方法，使用领域词典和标注数据来提高低资源领域中的命名实体识别效果，避免大规模数据调整的同时，在科技设备领域数据集上实现了显著的 F1 分数提升。

Mar, 2022

FactMix: 使用少量领域内标注样本泛化到跨领域命名实体识别

本文提出了一种基于理性的两步数据增强方法来提高模型的泛化性能，用于跨域 NER 任务，结果表明我们的模型无论是在数据增强还是提示调整方法中都显著提高了交叉域 NER 任务的性能。

Aug, 2022

CrossNER: 跨领域命名实体识别的评估

为了解决交叉域命名实体识别 (NER) 任务中样本少的问题，作者提出了一个跨领域 NER 数据集 CrossNER, 进行了一系列实验来探索利用不同级别的领域语料库和预训练策略进行域自适应预训练的有效性，研究表明利用包含领域特定实体的分数语料库并采用更具挑战性的预训练策略对于 NER 的域自适应有益，提出的方法在跨领域 NER 基线上效果更好。

Dec, 2020

具有最少资源的神经跨语言命名实体识别

提出了一种基于双语单词嵌入的翻译方法，以改善跨语言的 named-entity recognition 性能，并使用 self-attention 来提高鲁棒性。在对常见语言的测试中达到了最先进或具有竞争力的 NER 性能。

Aug, 2018

跨领域命名实体识别的数据增强

通过学习不同领域间的文本模式和数据特征，并为高资源领域提供低资源领域数据增强，我们提出了一种新的神经架构，可以大幅提高命名实体识别任务性能。

Sep, 2021

语言模型的混合专家用于命名实体识别

提出了一种基于 Mixture of Experts (MoE) 的强大的命名实体识别（NER）模型 BOND-MoE，通过使用多个模型在 EM 框架下进行集成，可以显著减轻噪声监督带来的问题，并引入公平分配模块来平衡文档 - 模型分配过程，实验证明该方法在真实数据集上取得了与其他远程监督 NER 方法相比的最先进性能。

Apr, 2024

无标记数据下的命名实体识别：一种弱监督方法

文章提出了一种简单但有效的方法，通过弱监督机制在没有标注数据的情况下学习 NER 模型，该方法使用广泛的标注功能对目标域中的文本进行自动注释，然后通过隐马尔可夫模型将这些注释合并在一起，从而最终基于这个统一的注释训练一个序列标注模型。通过在两个英文数据集上的评估（CoNLL 2003 和来自路透社和彭博社的新闻文章），相比于域外神经 NER 模型，在实体级别的 F1 得分上取得了约 7 个百分点的提升。

Apr, 2020

面向目标的零资源命名实体识别微调

本文提出了一个以目标为导向的微调框架，从特定领域、语言和任务等三个方面利用各种数据来解决零资源命名实体识别中的数据稀缺问题，并在六个基准测试中实现了新的最先进性能表现。

Jul, 2021