借助语义驱动的对抗性方法指出关系提取模型的不足

Feb, 2024

借助语义驱动的对抗性方法指出关系提取模型的不足

Pointing out the Shortcomings of Relation Extraction Models with Semantically Motivated Adversarials

Gennaro Nolano, Moritz Blum, Basil Ell, Philipp Cimiano

TL;DR近年来，大型语言模型在各种自然语言处理任务中取得了最先进的性能。然而，研究表明这些模型往往依赖于简化特征，导致不准确的预测，并使得模型在泛化到分布外样本时不可靠。本研究描述了几种基于语义的策略来生成替代实体提及的对抗样本，并调查了最先进的关系抽取模型在压力下的性能。我们的分析结果显示，这些模型在修改后的数据集上的性能显著下降（F1 平均下降 48.5%），这表明这些模型严重依赖于简化的特征，如实体的表面形式（或其模式），而没有充分利用句子中存在的信息。

Abstract

In recent years, large language models have achieved state-of-the-art performance across various NLP tasks. However, investigations have shown that these models tend to rely on →

large language models shortcut features relation extraction adversarial examples performance

发现论文，激发创造

实体和关系抽取中的情境化和泛化

本文主要研究了最新的自然语言处理技术中，神经网络和语言模型在命名实体识别和关系抽取方面的应用以及它们在训练过程中面临的一些挑战。我们发现，预训练的语言模型对发现未曾见过的命名实体表现良好，但对于未曾见过的关系则有待加强，因此模型的理解能力仍存在提升空间。

Jun, 2022

重新思考文档级关系抽取：现实检验

本文针对文档级关系抽取领域中广泛存在的一种强假设，即所有命名实体都已经完美地本地化、标准化和分类，通过构造四种类型的实体提及攻击，对典型的文档级关系提取模型进行行为探测，发现大多数当前的文档级关系提取模型易受实体提及攻击的影响，难以在真实世界的自然语言处理应用中部署，在未来的研究中建议停止简化问题设置，并在真实环境下建模文档级关系提取。

Jun, 2023

使用挑战数据揭示关系抽取模型的浅层启发式

通过研究数据采集和注释过程中的分布偏差，我们提出了一种称为 Challenging RE (CRE) 的挑战性数据集，分析了四个最先进的关系抽取 (RE) 模型的失败模式，挖掘了它们浅层启发式算法的局限性，并发现替代的问答建模表现显著更好，提供了改进数据收集的具体建议。

Oct, 2020

大语言模型时代下关系抽取的再审视

本文探讨了利用 GPT-3 和 Flan-T5 等大型语言模型来进行关系提取（RE）的问题，通过将关系线性化生成目标字符串的方法进行了序列到序列的任务处理，通过人工评估的方式，在不同程度的监督下评估了它们在标准 RE 任务中的表现，发现通过 GPT-3 进行的少量提示与现有完全监督模型大致相当，而使用 Chain-of-Thought 风格的解释进一步监督和微调后，该模型产生了最优结果。

May, 2023

提升关系抽取的敌对视角

提出了一种针对关系抽取的对抗训练方法，通过序列和标记级的扰动引入独立的扰动词汇表来改进对实体和上下文扰动的搜索，引入了一种概率策略在对抗训练上使上下文的清理标记数更多，实验证明相比于其他对抗训练方法，该方法显著提高了模型的准确性和鲁棒性，同时在数据可用性不足的情况下也表现出良好的效果。

Apr, 2024

关系之间的关系：关系抽取问题的新范式

本文提出了一种基于图神经网络和关系矩阵变换器的数据驱动关系提取新方法，不需要手工规则，能够完整考虑同一个上下文中的多个关系，并通过对 ACE05 数据集和 SemEval 2018 Task 7.2 等数据集的实验验证，证明该方法优于现有方法 1.12％到 2.55％不等。

Jun, 2020

知晓假阴性：一种远程监督关系抽取的对抗训练方法

本文提出一种两阶段的远程监督关系抽取方法，利用深度神经网络的记忆机制和对抗训练解决当前知识库不完整所带来的假阴性问题，并在两个流行基准数据集上验证了方法的有效性。

Sep, 2021

把握要点：为零 shot 关系抽取量身定制大型语言模型

通过使用语言模型生成初始种子实例并结合反馈进行改进，在关系抽取任务中实现零样本学习，取得了较基准方法更好的性能。

Feb, 2024

论文级关系抽取模型对实体名称变化的鲁棒性研究

通过使用维基数据生成改名实体的文档，并对三个代表性文档级关系抽取模型和两个大规模语言模型在强化学习环境下进行实验，发现他们对实体名称的变化缺乏鲁棒性，尤其是在跨句子关系实例和包含更多实体的文档中。因此，我们提出了一种强化学习的训练方法，旨在改进文档级关系抽取模型的鲁棒性并增强其理解和推理能力。同时我们还证实了该方法的基本思想同样适用于 DocRE 的上下文学习。

Jun, 2024

句子级关系抽取的改进基准线

该文介绍了基于句子的关系抽取问题，着重探讨了影响现有关系抽取模型性能的实体表示和噪声标签问题，并利用预训练语言模型提出了改进的基线模型，在 TACRED 数据集上取得了 F1 分数 74.6%，在 Re-TACRED 数据集上取得了 F1 分数 91.1%，证明预训练语言模型在该任务上具有高性能。

Feb, 2021