基于一致性引导的零样本文档级关系三元组提取中的知识检索和去噪
本文介绍了 Zero-RTE 任务及其解决方案 —— 使用结构化的提示模板来生成合成关系样本,并使用三元组搜寻解码方法来克服在句子中提取多个关系三元组的限制。实验表明,RelationPrompt 对于 Zero-RTE 任务和零样本关系分类非常有效。
Mar, 2022
通过集成大型语言模型和自然语言推理模块,我们提出一种自动标注方法来生成关系三元组,从而增强文档级关系数据集,我们通过介绍增强的数据集 DocGNRE 展示了我们方法的有效性,该方法在重新注释众多长尾关系类型方面表现出色,并且在推进广义语言语义理解方面提供了实际好处。
Nov, 2023
该论文提出了一种新的方法,利用大规模无标签文本中可预测的分布式数据结构从而构建了一个去噪的语料库,该方法通过远成本的监督技术以少量的样本数训练出了类似于 Soares 等人的零样本和少样本结果,该技术通过小型的多语言编码器在英语和西班牙语的一些标准关系评估中实现了与当前领先技术相当的结果。
Dec, 2020
本研究聚焦于使用大型语言模型作为无样本关系抽取器。通过分析现有关系抽取提示的不足之处,并引入诸如 CoT 的最新提示技术,我们提出了一种名为 SumAsk 的简单提示方法,通过使用大型语言模型将关系抽取输入转化为有效的问答格式。同时,我们在各种基准测试和设置上进行了广泛的实验,研究了大型语言模型在无样本关系抽取方面的能力,发现 SumAsk 方法在不同模型尺寸、基准测试和设置上都能显著提高大型语言模型的性能,在与无样本和完全监督方法相比具有一定竞争力甚至优越性能的同时,大型语言模型在提取重叠关系方面表现出了良好的性能,然而,不同的关系之间性能差异较大,大型语言模型相较于小型语言模型在处理挑战性的无适用项关系时表现出了有效性。
Oct, 2023
本研究提出了一种基于预训练模型的方法,用于减少文档级别关系抽取中由远程监督产生的噪声。实验结果表明,该方法能够从噪声数据中捕获有用的信息,取得了良好的效果。
Nov, 2020
本文提出了一种使用不确定性估计技术的文档层次远程关系提取框架 UDGDE,它通过新颖的实例级不确定性估计方法测量重叠关系的伪标签的可靠性,并针对长尾问题设计动态的不确定性阈值以过滤高不确定性的伪标签,实验证明该框架在两个公共数据集上性能优于基线算法。
May, 2023
本研究介绍了一种名为 PCRED 的零样本关系三元组抽取方法,采用候选关系选择和实体边界检测的方法,不依赖于额外的数据且表现优异,最终实验结果表明 PCRED 方法始终优于以往研究。
Nov, 2022
大规模嘈杂训练数据中的文档级关系抽取问题是一个具有挑战性的领域,本研究提出了一种集成可训练内存模块(Token Turing Machine)和嘈杂鲁棒性损失函数的新方法 TTM-RE,通过在 ReDocRED 基准数据集上进行广泛实验,实现了最先进的性能表现(F1 得分提高了 3% 以上),并在其他领域(如生物医学领域的 ChemDisGene 数据集)和高度未标记的情境下展现了 TTM-RE 的优越性.
Jun, 2024