REFinD:金融关系抽取数据集
本文提出了一个新的金融实体关系抽取数据集 FinRED,并在此数据集上对各种最先进的关系抽取模型进行试验,结果显示当前的模型在金融领域的性能较差,需要更好的模型。
Jun, 2023
本文使用了 ICL 框架下的 OpenAI 模型,采用两种检索策略在 REFinD 数据集中取得了较好的结果,获得了第 4 名的成绩,最佳 F1 分数为 0.718。
Jun, 2023
本研究综述了关系抽取领域深度学习技术的现状,涵盖资源、分类、挑战和未来方向等方面,有望促进研究者共同探索真实生活中关系抽取系统的挑战。
Jun, 2023
本文提出了一个多实体类型和多关系对的文献级生物医学关系抽取数据集 BioRED,包括新发现和先前已知的信息,旨在评估现有状态下的自动化算法,为更准确、高效和稳健的生物医学关系系统的开发奠定基础。
Apr, 2022
本研究提出了一种简单而有效的策略,通过结合命名实体识别和词性标注,以及不同的信息组合方法,改进了预训练语言模型的性能,用于解决金融关系提取任务。对金融关系数据集的实验证明了其有希望的结果,并突出了结合命名实体识别和词性标注在现有模型中的优势。
May, 2024
本文提出了一种新的跨领域关系抽取基准,并提供了元数据和多标签注释来帮助理解困难实例。作者通过在六个不同的文本领域上进行评估,评估了最先进的关系分类模型,发现跨领域关系抽取的困难性,为该方向的研究提供了新的数据集和启示。
Oct, 2022
本研究提出了一种方法,以便快速生成高质量数据集用于关系抽取任务,并训练神经模型以对所创建的数据集进行关系抽取来实现很好的结果,并广泛适用于其他数据集。研究中,我们能够在合理的时间内注释 10,022 个句子的 19 种关系,并为每种关系训练一个常用的基线模型。
Apr, 2022
该论文介绍了一个用于解决低资源场景下关系抽取的方法,该方法基于自监督学习和对比学习,以一致的目标进行预训练和微调,在两个数据集上的实验表明,该方法在使用 1% 的数据时,较基于 PLM 的分类器分别提高了 10.5%和 5.8%的性能水平。
Dec, 2022
本文对关系抽取数据集进行了全面的调查及研究任务定义及其应用。 研究发现,跨数据集和跨领域设置特别缺乏,并通过对两个数据集的科学关系分类进行了实证研究,发现注释存在实质性的差异,这解释了跨数据集评估中大幅度下降的原因。 最后,本研究呼吁在关系抽取中更加严格地报告设定和跨多个测试集进行评估。
Apr, 2022
本文介绍 DocRED 数据集,该数据集为文档级别中关系抽取 (Relation Extraction) 提供了一个新的方法,并提供了大规模的远程监督数据,以满足超级 / 弱监督训练需求。同时我们实验了目前最先进的方法,结果表明文档级别中关系抽取仍需要进一步的研究。
Jun, 2019