重新思考生成式命名实体识别的负实例

Feb, 2024

重新思考生成式命名实体识别的负实例

Rethinking Negative Instances for Generative Named Entity Recognition

Yuyang Ding, Juntao Li, Pinzheng Wang, Zecheng Tang, Bowen Yan...

TL;DR通过引入负实例并采用分层匹配算法，本研究在大型语言模型上实现了对命名实体识别任务的改进，提出了改进的零样本性能的生成式 NER 系统 GNER。

Abstract

large language models (LLMs) have demonstrated impressive capabilities for generalizing in unseen tasks. In the named entity recognition (NER) task, recent advancements have seen the remarkable improvement of LLM

large language models named entity recognition instruction tuning negative instances generative ner system

发现论文，激发创造

命名实体识别中未标注实体问题的实证分析

通过使用负采样，避免 NER 模型的训练受到未标注实体的干扰，提出了一种能够有效应对未标注实体问题的方法。在实验中，该方法表现出很强的鲁棒性，甚至能够超越现有的基线模型。

Dec, 2020

GPT-NER：基于大型语言模型的命名实体识别

本文介绍了一种基于 GPT 模型的 NER 算法 ——GPT-NER，它通过将序列标注任务转化为生成任务来弥补 LLMs 在 NER 任务上的缺陷，并提出自我验证策略以解决 LLMs 易出现的幻觉问题。实验结果表明，该算法表现与有监督算法相当，在低资源学习中表现显着优于有监督模型，具有实现限制样本 NER 应用的能力。

Apr, 2023

NERetrieve: 下一代命名实体识别与检索数据集

通过大规模语言模型，命名实体识别可以达到更精细化的实体类型识别、零样本识别和语句检索等目标，但这些目标仍然需要进一步研究和探索。

Oct, 2023

llmNER：利用大型语言模型的（零 | 少）样本命名实体识别

llmNER 是一个用于实现 LLMs 的零射击和少射击 NER 的 Python 库，通过提供易于使用的接口，llmNER 可以组合提示、查询模型，并解析 LLM 返回的完成结果。该库还通过提供简单的接口来测试多个变量，让用户可以高效地执行提示工程。我们在两个 NER 任务上验证了我们的软件，以展示该库的灵活性。llmNER 旨在推动上下文学习研究的界限，消除提示和解析步骤的障碍。

Jun, 2024

ChatGPT 中零样本命名实体识别的实证研究

该论文主要研究大型语言模型在零 - shot 信息提取方面的性能，并提出针对命名实体识别的推理策略，包括分解式问答范式、句法增强和自一致性等方法，并在七个基准测试中取得了显著的改进，对错误类型进行了全面分析，并验证了这些方法在少样本情况和其他大型语言模型中的有效性。

Oct, 2023

LinkNER: 使用不确定性将本地命名实体识别模型与大型语言模型连接

通过将小型微调模型与大型语言模型（LinkNER）结合、以及一种基于不确定性的链接策略（RDC），以提高 NER 任务性能并在鲁棒性测试中明显超过 SOTA 模型，我们量化分析了关键组件如不确定性估计方法、大型语言模型和上下文学习对各种 NER 任务的影响，提供了具体的与网络相关的建议。

Feb, 2024

NuNER：通过 LNN 标注数据进行实体识别编码器预训练

利用大型语言模型，本研究表明如何创建 NuNER，这是一种专注于命名实体识别（NER）任务的紧凑语言表示模型，可以进行低数据需求的微调，该模型在 few-shot 情景下胜过了类似大小的基础模型，并与更大的语言模型竞争。研究发现预训练数据集的大小和实体类型多样性是取得良好性能的关键。我们将 NuNER 视为最近由语言模型解锁的任务特定基础模型之一。

Feb, 2024

少样本命名实体识别：综合研究

本文提出了一种有效地建立识别命名实体（NER）系统的方法，基于最近的基于转换器的自我监督预训练语言模型（PLMs），并探讨了三种正交的方案来改进针对少样例情况的模型泛化能力，通过大量实验结果表明，我们的方法在少数样例学习环境中显著改善或优于基于域标记微调的 PLM 线性分类器等基线方法，同时在无训练和少样例学习环境下建立了最新的业界记录。

Dec, 2020

GLiNER: 使用双向 Transformer 进行命名实体识别的通用模型

本研究论文介绍了一种紧凑的命名实体识别模型 GLiNER，通过双向变压器编码器实现并行实体抽取，同时在各种命名实体基准测试中展现出强大的性能，优于 ChatGPT 和经过微调的大型语言模型。

Nov, 2023

一种用于小样本命名实体识别的统一标签感知对比学习框架

我们提出了统一的标签感知令牌级对比学习框架，通过利用标签语义作为后缀提示来丰富上下文，同时优化上下文 - 上下文和上下文 - 标签对比学习目标，从而提高推广辨别性的上下文表示。广泛的实验表明我们的方法在各种传统测试领域和大规模少样本 NER 数据集上优于先前的最先进模型，微粒 F1 分数平均绝对增益达到 7%。进一步的分析揭示了我们模型受益于其强大的迁移能力和改进的上下文表示。

Apr, 2024