终止无效比较：端到端关系抽取

EMNLPSep, 2020

Let's Stop Incorrect Comparisons in End-to-end Relation Extraction!

Bruno Taillé, Vincent Guigue, Geoffrey Scoutheeten, Patrick Gallinari

TL;DR本文针对目前关系提取领域中性能比较不可靠的问题，提出了一些无效比较的模式，并进行了实证研究来量化最常见错误对最终关系提取性能的影响，揭示了 BERT 和 span-level NER 的不足。本文强调在评估环节中应统一评估设置和数据集统计，并呼吁在 end-to-end 关系提取领域建立公认的评估标准。

Abstract

Despite efforts to distinguish three different evaluation setups (Bekoulis et al., 2018), numerous end-to-end relation extraction (RE) articles present unreliable performance comparison to previous work. In this

relation extraction performance comparison invalid comparisons language model pretraining span-level ner

发现论文，激发创造

朝着现实低资源关系抽取的方向：具有实证基线研究的基准测试

本文通过三种不同的方案对低资源情况下关系抽取系统进行了全面研究，并创建了包含 8 个 RE 数据集的基准，示范了不同的方法与结合的影响，结果表明虽然基于提示的调整有助于低资源 RE，但在从跨句子上下文中提取多个关系三元组时仍有很大改善潜力，数据增强与自我训练可以较好地充实现有基准，并可带来很多性能提升，然而自我训练并不能始终实现低资源关系抽取的进步。

Oct, 2022

REflex: 在多个领域中灵活进行关系抽取的框架

本文通过在三个常用数据集上的系统探索建立关系提取的统一框架，发现预处理对性能的影响巨大，且缺少信息会进一步阻碍公平比较，文章还就未来研究提出了建议。

Jun, 2019

关系抽取的含义是什么？有关数据集的调查和科学关系分类研究

本文对关系抽取数据集进行了全面的调查及研究任务定义及其应用。研究发现，跨数据集和跨领域设置特别缺乏，并通过对两个数据集的科学关系分类进行了实证研究，发现注释存在实质性的差异，这解释了跨数据集评估中大幅度下降的原因。最后，本研究呼吁在关系抽取中更加严格地报告设定和跨多个测试集进行评估。

Apr, 2022

神经度量学习用于快速端到端关系抽取

本文提出了一种新颖的神经架构，利用表格结构和二维卷积技术进行本地依赖特征池化，从而改善了以往的最佳性能，在不需要全局优化的前提下实现了端对端关系提取任务（包括命名实体识别和关系抽取），相较于之前最好的结果提高了约 1％的 F1 分数，并且训练和测试时间快 7 至 10 倍。

May, 2019

重新思考文档级关系抽取：现实检验

本文针对文档级关系抽取领域中广泛存在的一种强假设，即所有命名实体都已经完美地本地化、标准化和分类，通过构造四种类型的实体提及攻击，对典型的文档级关系提取模型进行行为探测，发现大多数当前的文档级关系提取模型易受实体提及攻击的影响，难以在真实世界的自然语言处理应用中部署，在未来的研究中建议停止简化问题设置，并在真实环境下建模文档级关系提取。

Jun, 2023

实体和关系抽取中的情境化和泛化

本文主要研究了最新的自然语言处理技术中，神经网络和语言模型在命名实体识别和关系抽取方面的应用以及它们在训练过程中面临的一些挑战。我们发现，预训练的语言模型对发现未曾见过的命名实体表现良好，但对于未曾见过的关系则有待加强，因此模型的理解能力仍存在提升空间。

Jun, 2022

使用预训练语言模型的端到端命名实体识别和关系抽取

本文提出了一种基于神经元的端到端模型来联合提取实体和它们的关系，该模型不依赖于外部自然语言处理工具，而是集成了大量的预训练语言模型，在三个领域的五个数据集上，我们的模型可以与最先进的性能相提并论，有时甚至具有更高的性能。

Dec, 2019

深度学习在关系抽取中的综合调查：最新进展与新前沿

本研究综述了关系抽取领域深度学习技术的现状，涵盖资源、分类、挑战和未来方向等方面，有望促进研究者共同探索真实生活中关系抽取系统的挑战。

Jun, 2023

持续对比微调改善低资源关系提取

该论文介绍了一个用于解决低资源场景下关系抽取的方法，该方法基于自监督学习和对比学习，以一致的目标进行预训练和微调，在两个数据集上的实验表明，该方法在使用 1% 的数据时，较基于 PLM 的分类器分别提高了 10.5％和 5.8％的性能水平。

Dec, 2022

句子级关系抽取的改进基准线

该文介绍了基于句子的关系抽取问题，着重探讨了影响现有关系抽取模型性能的实体表示和噪声标签问题，并利用预训练语言模型提出了改进的基线模型，在 TACRED 数据集上取得了 F1 分数 74.6%，在 Re-TACRED 数据集上取得了 F1 分数 91.1%，证明预训练语言模型在该任务上具有高性能。

Feb, 2021