AIFB-WebScience 参加 SemEval-2022 Task 12: 首先进行关系抽取 -- 利用关系抽取技术识别实体
本研究提出了一种简单的流水线方法来进行实体和关系抽取,并在标准基准测试中确立了新的最佳结果,通过对实体和关系进行不同的上下文表示,融合实体信息来提高性能,同时在全局上下文中引入信息以提高准确性。
Oct, 2020
在 ACM KDF-SIGIR 2023 竞赛中,我们对名为 REFind 的金融实体关系数据集进行了实体关系任务。我们采用了一个多步骤的方法,首先将提供的实体插入到相应的文本位置,然后利用带标签的训练集对基于 transformer 的语言模型 roberta-large 进行微调,以预测实体关系。最后,我们实施了后处理阶段,来识别和处理模型生成的不太可能的预测。由于我们的方法,我们在竞赛的公共排行榜上获得了第一名的排名。
Aug, 2023
我们提出了一种新的方法,将无结构文本中的实体和关系提取作为条件序列生成问题,采用基于跨度的方法生成线性化图,其中节点表示文本跨度,边表示关系三元组。通过跨度表示,我们的模型可以捕捉实体和关系的结构特征和边界,并通过指向机制将生成的输出与原始文本进行关联。基准数据集上的评估验证了我们方法的有效性,展示了竞争性的结果。
Jan, 2024
本文提出了一种基于神经元的端到端模型来联合提取实体和它们的关系,该模型不依赖于外部自然语言处理工具,而是集成了大量的预训练语言模型, 在三个领域的五个数据集上,我们的模型可以与最先进的性能相提并论,有时甚至具有更高的性能。
Dec, 2019
关系抽取是一种从网络上挖掘人类知识的高效方式,本文提出了一种名为 GraphScholarBERT 的开放领域信息抽取方法,它能够从半结构化的网页中提取目标关系,并能在未见过的领域中进行泛化,无需额外数据或训练,并且与搜索关键词完全匹配。实验证明,GraphScholarBERT 在零射击域和零射击网站情境下,相比以往的方法,可以提高抽取的 F1 分数达 34.8%。
Feb, 2024
提出一种无需实体级别监督的实体链接和关系抽取模型,避免了流水线方法中产生的级联错误,并在两个生物医学数据集上优于最先进的实体链接和关系抽取流水线,极大地提高了系统的总体召回率。
Dec, 2019
本篇论文介绍了我们参加 BioNLP Shared Tasks 2019 后在 Named Entity Recognition 和 Relation Extraction 方面的方法,我们的方法可以概括应用于不同语言的文本,包括英语和西班牙语,其中我们使用了语言特征,混合损失,多任务目标和令牌级合成策略以提高 Named Entity Recognition 的性能,使用基于字典的模糊和语义搜索来执行实体标准化, 最后,我们的 Relation Extraction 系统使用带语言特征的 Support Vector Machine,并在相关任务上表现出色。
Oct, 2019
本文提出一个神经网络模型,用于联合抽取命名实体和它们之间的关系,无需手动设计特征。该模型采用深度双仿射关注层扩展了 BiLSTM-CRF 实体识别模型,以建模关系分类中潜在特征的二阶交互。在 benchmark 数据集 CoNLL04 上进行实验,结果显示该模型的表现优于之前的模型,创造了新的最好表现。
Dec, 2018
本文提出了一种基于联合学习模型的生物医学因果关系提取方法,将实体关系提取和实体功能检测结合起来,以提高因果关系提取的性能,并且在模型训练阶段,为不同的功能类型分配不同的权重,实验结果表明,与其他系统相比,我们的联合学习系统在 BEL 语句提取中取得了最先进的表现。
Aug, 2022
本文介绍了我们参加 SemEval-2022 多语言复杂命名实体识别英文赛道的基于 Transformer 预训练模型的简单有效基准系统,取得了 72.50% 的 F1 得分,同时讨论了通过实体链接进行数据增强的方法。
Feb, 2022