基于一致性引导的零样本文档级关系三元组提取中的知识检索和去噪

WWWJan, 2024

基于一致性引导的零样本文档级关系三元组提取中的知识检索和去噪

Consistency Guided Knowledge Retrieval and Denoising in LLMs for Zero-shot Document-level Relation Triplet Extraction

Qi Sun, Kun Huang, Xiaocui Yang, Rong Tong, Kun Zhang...

TL;DR本文提出了一种零样本文档级关系三元组提取（ZeroDocRTE）框架，通过从大型语言模型（LLMs）中检索和去噪知识生成标记数据，用于提取具有语义关系的实体，实现了零样本文档级关系和三元组的提取任务。

Abstract

document-level relation triplet extraction (DocRTE) is a fundamental task in information systems that aims to simultaneously extract entities with semantic relations from a document. Existing methods heavily rely on a substantial amount of fully →

document-level relation triplet extraction zero-shot document-level relation triplet extraction large language models labeled data denoising strategy

发现论文，激发创造

RelationPrompt: 利用提示生成合成数据以进行零样本关系三元组抽取

本文介绍了 Zero-RTE 任务及其解决方案 —— 使用结构化的提示模板来生成合成关系样本，并使用三元组搜寻解码方法来克服在句子中提取多个关系三元组的限制。实验表明，RelationPrompt 对于 Zero-RTE 任务和零样本关系分类非常有效。

Mar, 2022

基于大语言模型的远程监督半自动文档级关系抽取数据增强

通过集成大型语言模型和自然语言推理模块，我们提出一种自动标注方法来生成关系三元组，从而增强文档级关系数据集，我们通过介绍增强的数据集 DocGNRE 展示了我们方法的有效性，该方法在重新注释众多长尾关系类型方面表现出色，并且在推进广义语言语义理解方面提供了实际好处。

Nov, 2023

基于生成元学习的零样本关系三元组抽取

本研究提出了一种新颖的生成元学习框架，旨在提高生成模型的泛化能力，该框架在零样本关系三元组提取任务中达到了新的最先进性能。

May, 2023

基于事件引导的去噪多语种关系学习

该论文提出了一种新的方法，利用大规模无标签文本中可预测的分布式数据结构从而构建了一个去噪的语料库，该方法通过远成本的监督技术以少量的样本数训练出了类似于 Soares 等人的零样本和少样本结果，该技术通过小型的多语言编码器在英语和西班牙语的一些标准关系评估中实现了与当前领先技术相当的结果。

Dec, 2020

再探大型语言模型作为零 - shot 关系抽取器

本研究聚焦于使用大型语言模型作为无样本关系抽取器。通过分析现有关系抽取提示的不足之处，并引入诸如 CoT 的最新提示技术，我们提出了一种名为 SumAsk 的简单提示方法，通过使用大型语言模型将关系抽取输入转化为有效的问答格式。同时，我们在各种基准测试和设置上进行了广泛的实验，研究了大型语言模型在无样本关系抽取方面的能力，发现 SumAsk 方法在不同模型尺寸、基准测试和设置上都能显著提高大型语言模型的性能，在与无样本和完全监督方法相比具有一定竞争力甚至优越性能的同时，大型语言模型在提取重叠关系方面表现出了良好的性能，然而，不同的关系之间性能差异较大，大型语言模型相较于小型语言模型在处理挑战性的无适用项关系时表现出了有效性。

Oct, 2023

文档级远程监督下的去噪关系抽取

本研究提出了一种基于预训练模型的方法，用于减少文档级别关系抽取中由远程监督产生的噪声。实验结果表明，该方法能够从噪声数据中捕获有用的信息，取得了良好的效果。

Nov, 2020

基于不确定性的文档级远程关系抽取标签去噪

本文提出了一种使用不确定性估计技术的文档层次远程关系提取框架 UDGDE，它通过新颖的实例级不确定性估计方法测量重叠关系的伪标签的可靠性，并针对长尾问题设计动态的不确定性阈值以过滤高不确定性的伪标签，实验证明该框架在两个公共数据集上性能优于基线算法。

May, 2023

PCRED: 无需候选关系选择和实体边界检测的零样本关系三元组抽取

本研究介绍了一种名为 PCRED 的零样本关系三元组抽取方法，采用候选关系选择和实体边界检测的方法，不依赖于额外的数据且表现优异，最终实验结果表明 PCRED 方法始终优于以往研究。

Nov, 2022

TTM-RE：记忆增强的文档级关系抽取

大规模嘈杂训练数据中的文档级关系抽取问题是一个具有挑战性的领域，本研究提出了一种集成可训练内存模块（Token Turing Machine）和嘈杂鲁棒性损失函数的新方法 TTM-RE，通过在 ReDocRED 基准数据集上进行广泛实验，实现了最先进的性能表现（F1 得分提高了 3% 以上），并在其他领域（如生物医学领域的 ChemDisGene 数据集）和高度未标记的情境下展现了 TTM-RE 的优越性.

Jun, 2024

把握要点：为零 shot 关系抽取量身定制大型语言模型

通过使用语言模型生成初始种子实例并结合反馈进行改进，在关系抽取任务中实现零样本学习，取得了较基准方法更好的性能。

Feb, 2024