PGA-SciRE: 利用数据增强增强科学关系抽取的 LLM

May, 2024

PGA-SciRE: 利用数据增强增强科学关系抽取的 LLM

PGA-SciRE: Harnessing LLM on Data Augmentation for Enhancing Scientific Relation Extraction

Yang Zhou, Shimin Shan, Hongkui Wei, Zhehuan Zhao, Wenshuo Feng

TL;DR提出了一种名为 PGA 的基于文本数据增强的框架，利用语言模型（LLMs）通过改写原始训练集样本来增加伪样本的数量，以提高科学领域关系抽取模型的性能，并通过生成含有与标签相关信息的句子来指导 LLMs 生成更多的伪样本，实验证明 PGA 框架可以显著提升科学领域关系抽取模型的 F1 分数，并且使用 LLMs 获取样本还能有效降低手动标记数据的成本。

Abstract

relation extraction (RE) aims at recognizing the relation between pairs of entities mentioned in a text. Advances in llms have had a tremendous impact on NLP. In this work, we propose a →

relation extraction llms textual data augmentation scientific domain f1 scores

发现论文，激发创造

GPT-RE：利用大型语言模型进行关系抽取的上下文学习

本研究介绍了 GPT-RE，这是一种解决大型语言模型在关系提取中局限性的方法，包括任务特定实体表现的使用和黄金标签引导推理逻辑的使用。该方法在四个数据集上的实验结果表明其超过了 GPT-3 基线并且在 Semeval 和 SciERC 数据集上实现了 SOTA 表现。

May, 2023

在检索增强生成框架中使用经过微调的大型语言模型进行关系抽取

Fine-tuned large language models integrated into the Retrieval-Augmented-based approach demonstrate exceptional performance in identifying implicit relations, surpassing previous results on SemEVAL and achieving substantial gains on TACRED, TACREV, and Re-TACRED datasets.

Jun, 2024

把握要点：为零 shot 关系抽取量身定制大型语言模型

通过使用语言模型生成初始种子实例并结合反馈进行改进，在关系抽取任务中实现零样本学习，取得了较基准方法更好的性能。

Feb, 2024

GDA：用于关系抽取任务的生成式数据增强技术

本研究提出了一种名为 GDA 的专用增强技术，该技术使用两个互补的模块来保留句子的语义一致性和语法结构，在低资源环境下取得了 2.0％的 F1 改进。

May, 2023

检索增强的基于生成的关系抽取

信息抽取是将非结构化文本数据转化为结构化格式的一种变革性过程，本研究提出了一种提高关系抽取任务性能的基于检索增强生成的关系抽取方法，并通过使用不同的大型语言模型对其进行了有效性评估。结果显示，该方法在信息抽取任务中表现出卓越的性能，特别是在 TACRED 数据集及其变体上。此外，与以往的方法相比，该方法在 TACRED 和 TACREV 数据集上的表现也非常出色，凸显了它在自然语言处理的关系抽取任务中的有效性和潜力。

Apr, 2024

基于大语言模型的远程监督半自动文档级关系抽取数据增强

通过集成大型语言模型和自然语言推理模块，我们提出一种自动标注方法来生成关系三元组，从而增强文档级关系数据集，我们通过介绍增强的数据集 DocGNRE 展示了我们方法的有效性，该方法在重新注释众多长尾关系类型方面表现出色，并且在推进广义语言语义理解方面提供了实际好处。

Nov, 2023

基于检索增强生成的大型语言模型的因果图发现

使用大语言模型从科学文献中提取关联关系，构建高质量的因果图。

Feb, 2024

低资源情境下，LLM 在关系抽取中的表现如何？综合评估

该研究构建了十个低资源语言的关系抽取数据集，并利用语言困惑度对翻译数据进行过滤，最后在这些数据集上评估了开源大型语言模型的性能。

Jun, 2024

AutoRE：基于大型语言模型的文档级关系抽取

通过引入 AutoRE 模型和 RHF (Relation-Head-Facts) 的新型 RE 提取范式，结合 QLoRA (Parameters Efficient Fine Tuning) 算法构建了一个易于扩展的 DocRE 框架，在 RE-DocRED 数据集上展现了最佳性能，超过 dev 和 test 集合上分别为 TAG 10.03% 和 9.03% 的最新结果。

Mar, 2024

从未标注的文本中学习关系原型以进行长尾关系提取

本论文提出一种学习关系原型的通用方法来处理关系抽取中的长尾问题，并应用于基于共现图的嵌入学习来优化实体对与对应原型间的距离，并在两个数据集上进行了广泛实验以验证其有效性。

Nov, 2020