远程监督关系抽取综述:以去噪和预训练方法为重点
本研究综述了关系抽取领域深度学习技术的现状,涵盖资源、分类、挑战和未来方向等方面,有望促进研究者共同探索真实生活中关系抽取系统的挑战。
Jun, 2023
该研究论文介绍了知识在自然语言处理中的重要性,并综述了基于深度神经网络的关系抽取技术,包括有监督和远程监督方法。此外,还讨论了该技术的一些新方法和未来研究方向。
Jan, 2021
本文介绍了关系抽取(RE)的若干重要的监督、半监督和无监督技术,以及开放信息抽取(OIE)和远程监督的范例,最后描述了近期 RE 技术和未来研究方向。这篇综述对于领域的新手、研究人员和实践者都有用。
Dec, 2017
本文探讨了利用 GPT-3 和 Flan-T5 等大型语言模型来进行关系提取(RE)的问题,通过将关系线性化生成目标字符串的方法进行了序列到序列的任务处理,通过人工评估的方式,在不同程度的监督下评估了它们在标准 RE 任务中的表现,发现通过 GPT-3 进行的少量提示与现有完全监督模型大致相当,而使用 Chain-of-Thought 风格的解释进一步监督和微调后,该模型产生了最优结果。
May, 2023
本文提出了一种新的 DSRE-NLI 框架,该框架利用现有知识库的远程监督和预训练语言模型的间接监督,通过半自动关系语言表达机制为间接监督提供能量,进而巩固远程注释以便于多分类 RE 模型,并通过数据整合策略实现训练数据的质量提高,大量实验证明该框架显著提高了远程监督 RE 基准数据集的性能(高达 7.73%的 F1)
Jul, 2022
本篇论文介绍了一种基于 QA 数据集的间接标注来降低 DS 数据产生噪声的新方法 ReQuest,并使用学习到的嵌入估计测试关系提及的类型。实验结果在两个公共关系提取数据集上相结合以 TREC QA 数据集,F1 得分平均提高了 11%。
Oct, 2017
本论文提出基于实体的文档上下文过滤来构建输入并基于跨路径实体关系注意力的交叉文档关系提取模型,与现有方法比较,在 CodRED 数据集上取得至少 10% 的 F1 值的提升,从而展示其在跨文档关系提取中的有效性。
Oct, 2022
本研究提出了一种基于预训练模型的方法,用于减少文档级别关系抽取中由远程监督产生的噪声。实验结果表明,该方法能够从噪声数据中捕获有用的信息,取得了良好的效果。
Nov, 2020
研究利用深度强化学习策略生成假阳性指标解决远程监督产生的噪声,进而将它们分配为负面样本以解决误报问题,实验表明该方法显著提高了远程监督方法的性能。
May, 2018