关于评估最新关系抽取系统 F1 分数的研究

May, 2023

关于评估最新关系抽取系统 F1 分数的研究

About Evaluation of F1 Score for RECENT Relation Extraction System

Michał Olek

TL;DR讨论了 Shengfei Lyu 和 Huanhuan Chen 在 ACL-IJCNLP 2021 上发表的文章 “受实体类型限制的关系分类” 中使用的 F1 分数评估，讨论了他们创建的 RECENT 系统在 TACRED 数据集上的表现，最终结果为 65.16。

Abstract

This document contains a discussion of the f1 score evaluation used in the article 'relation classification with entity type restriction'

f1 score evaluation relation classification entity type restriction recent tacred dataset

发现论文，激发创造

带实体类型限制的关系分类

本文中，我们提出了一个新的模型架构，称为 RECENT，它利用实体类型限制候选关系，并形式化介绍了关系和实体类型之间的相互约束关系。在 GCN 和 SpanBERT 这两个表现较好的模型上进行实验，实验结果表明，RECENT 可以分别提升它们 6.9 个和 4.4 个 F1 点，并且 RECENT_SpanBERT 在 TACRED 上取得了新的最佳效果。

May, 2021

句子级关系抽取的改进基准线

该文介绍了基于句子的关系抽取问题，着重探讨了影响现有关系抽取模型性能的实体表示和噪声标签问题，并利用预训练语言模型提出了改进的基线模型，在 TACRED 数据集上取得了 F1 分数 74.6%，在 Re-TACRED 数据集上取得了 F1 分数 91.1%，证明预训练语言模型在该任务上具有高性能。

Feb, 2021

TACRED 重访：对 TACRED 关系抽取任务的全面评估

本文研究了 TACRED 数据集在关系抽取中高错误率的问题，通过训练标注者重新标注，了解了错误来源，发现部分标注错误和数据集中存在的歧义关系导致错误率高，对此提出对应解决方案，并验证了三种最先进的 RE 模型的错误假设。

Apr, 2020

中文医学文本中 BERT 联合实体和关系抽取的微调

该研究提出了一种基于 BERT 语言模型和聚焦注意力机制的联合实体和关系抽取模型，通过动态范围注意机制，提高了共享参数层的特征表示能力，实验结果表明，该方法在冠状动脉造影文本上的名词实体识别和关系分类任务的 F1 得分分别达到 96.89% 和 88.51%，优于现有技术水平。

Aug, 2019

关系抽取文档覆盖率预测

该论文介绍了一种新的任务，即预测文本文档的覆盖范围，以进行关系抽取和知识库构建，并提出了一种结合特征和 BERT 的模型，可以有效地预测覆盖范围和拒绝索赔。

Nov, 2021

AIFB-WebScience 参加 SemEval-2022 Task 12: 首先进行关系抽取 -- 利用关系抽取技术识别实体

本文提出了一种基于变压器语言模型的端到端联合实体和关系抽取方法，应用于将数学符号与 LaTeX 文档中的描述相关联的任务，并且代码公开可用。

Mar, 2022

GPT-FinRE: 使用大型语言模型进行金融关系抽取的上下文学习

本文使用了 ICL 框架下的 OpenAI 模型，采用两种检索策略在 REFinD 数据集中取得了较好的结果，获得了第 4 名的成绩，最佳 F1 分数为 0.718。

Jun, 2023

关系抽取在临床文档理解中的应用

该文介绍了一种文本挖掘框架，利用 Named Entity Recognition 和 Relation Extraction 模型对医学文献和数字临床记录进行处理，取得优异的实验结果，并构建了一个生物医学知识图谱。系统使用 Spark NLP 库提供的生产级、可伸缩、硬件优化、可训练和可调整的 NLP 框架。

Dec, 2021

BioNLP-OST 2019 中基于语言学的关系抽取和神经网络结构的嵌套命名实体识别

本篇论文介绍了我们参加 BioNLP Shared Tasks 2019 后在 Named Entity Recognition 和 Relation Extraction 方面的方法，我们的方法可以概括应用于不同语言的文本，包括英语和西班牙语，其中我们使用了语言特征，混合损失，多任务目标和令牌级合成策略以提高 Named Entity Recognition 的性能，使用基于字典的模糊和语义搜索来执行实体标准化，最后，我们的 Relation Extraction 系统使用带语言特征的 Support Vector Machine，并在相关任务上表现出色。

Oct, 2019

无监督开放式关系抽取

在无监督环境下，我们探讨了从自由文本中提取命名实体之间关系的方法。除了标准特征提取外，我们还开发了一种重新加权词嵌入的新方法。我们使用单个特征降维缓解了特征稀疏性问题。我们的方法在 NYT-FB 数据集上获得了 F1-score 为 0.416 的显着提高，优于现有技术水平 5.8%。

Jan, 2018