GPT-FinRE: 使用大型语言模型进行金融关系抽取的上下文学习
本研究介绍了 GPT-RE,这是一种解决大型语言模型在关系提取中局限性的方法,包括任务特定实体表现的使用和黄金标签引导推理逻辑的使用。该方法在四个数据集上的实验结果表明其超过了 GPT-3 基线并且在 Semeval 和 SciERC 数据集上实现了 SOTA 表现。
May, 2023
通过提出一种召回 - 检索 - 推理关系抽取框架,将大型语言模型与检索语料库相结合,从而使语言模型能够在上下文中进行可靠的推理,以提高关系抽取的性能。
Apr, 2024
本文探讨了利用 GPT-3 和 Flan-T5 等大型语言模型来进行关系提取(RE)的问题,通过将关系线性化生成目标字符串的方法进行了序列到序列的任务处理,通过人工评估的方式,在不同程度的监督下评估了它们在标准 RE 任务中的表现,发现通过 GPT-3 进行的少量提示与现有完全监督模型大致相当,而使用 Chain-of-Thought 风格的解释进一步监督和微调后,该模型产生了最优结果。
May, 2023
Fine-tuned large language models integrated into the Retrieval-Augmented-based approach demonstrate exceptional performance in identifying implicit relations, surpassing previous results on SemEVAL and achieving substantial gains on TACRED, TACREV, and Re-TACRED datasets.
Jun, 2024
通过集成大型语言模型和自然语言推理模块,我们提出一种自动标注方法来生成关系三元组,从而增强文档级关系数据集,我们通过介绍增强的数据集 DocGNRE 展示了我们方法的有效性,该方法在重新注释众多长尾关系类型方面表现出色,并且在推进广义语言语义理解方面提供了实际好处。
Nov, 2023
本文提出 REFinD 数据集,该数据集为金融文档中的大规模关系注释数据集,可用于信息检索、语义搜索、问题回答和文本蕴含等任务,同时对各种最先进的深度学习模型进行实证评估并强调数据集带来的挑战。
May, 2023
本研究提出了一种简单而有效的策略,通过结合命名实体识别和词性标注,以及不同的信息组合方法,改进了预训练语言模型的性能,用于解决金融关系提取任务。对金融关系数据集的实验证明了其有希望的结果,并突出了结合命名实体识别和词性标注在现有模型中的优势。
May, 2024
本研究综述了关系抽取领域深度学习技术的现状,涵盖资源、分类、挑战和未来方向等方面,有望促进研究者共同探索真实生活中关系抽取系统的挑战。
Jun, 2023
在 ACM KDF-SIGIR 2023 竞赛中,我们对名为 REFind 的金融实体关系数据集进行了实体关系任务。我们采用了一个多步骤的方法,首先将提供的实体插入到相应的文本位置,然后利用带标签的训练集对基于 transformer 的语言模型 roberta-large 进行微调,以预测实体关系。最后,我们实施了后处理阶段,来识别和处理模型生成的不太可能的预测。由于我们的方法,我们在竞赛的公共排行榜上获得了第一名的排名。
Aug, 2023