本文中,我们提出了一个新的模型架构,称为 RECENT,它利用实体类型限制候选关系,并形式化介绍了关系和实体类型之间的相互约束关系。在 GCN 和 SpanBERT 这两个表现较好的模型上进行实验,实验结果表明,RECENT 可以分别提升它们 6.9 个和 4.4 个 F1 点,并且 RECENT_SpanBERT 在 TACRED 上取得了新的最佳效果。
May, 2021
该文介绍了基于句子的关系抽取问题,着重探讨了影响现有关系抽取模型性能的实体表示和噪声标签问题,并利用预训练语言模型提出了改进的基线模型,在 TACRED 数据集上取得了 F1 分数 74.6%,在 Re-TACRED 数据集上取得了 F1 分数 91.1%,证明预训练语言模型在该任务上具有高性能。
Feb, 2021
本文研究了 TACRED 数据集在关系抽取中高错误率的问题,通过训练标注者重新标注,了解了错误来源,发现部分标注错误和数据集中存在的歧义关系导致错误率高,对此提出对应解决方案,并验证了三种最先进的 RE 模型的错误假设。
Apr, 2020
该研究提出了一种基于 BERT 语言模型和聚焦注意力机制的联合实体和关系抽取模型,通过动态范围注意机制,提高了共享参数层的特征表示能力,实验结果表明,该方法在冠状动脉造影文本上的名词实体识别和关系分类任务的 F1 得分分别达到 96.89% 和 88.51%,优于现有技术水平。
Aug, 2019
该论文介绍了一种新的任务,即预测文本文档的覆盖范围,以进行关系抽取和知识库构建,并提出了一种结合特征和 BERT 的模型,可以有效地预测覆盖范围和拒绝索赔。
Nov, 2021
本文提出了一种基于变压器语言模型的端到端联合实体和关系抽取方法,应用于将数学符号与 LaTeX 文档中的描述相关联的任务,并且代码公开可用。
Mar, 2022
本文使用了 ICL 框架下的 OpenAI 模型,采用两种检索策略在 REFinD 数据集中取得了较好的结果,获得了第 4 名的成绩,最佳 F1 分数为 0.718。
Jun, 2023
该文介绍了一种文本挖掘框架,利用 Named Entity Recognition 和 Relation Extraction 模型对医学文献和数字临床记录进行处理,取得优异的实验结果,并构建了一个生物医学知识图谱。系统使用 Spark NLP 库提供的生产级、可伸缩、硬件优化、可训练和可调整的 NLP 框架。
Dec, 2021
本篇论文介绍了我们参加 BioNLP Shared Tasks 2019 后在 Named Entity Recognition 和 Relation Extraction 方面的方法,我们的方法可以概括应用于不同语言的文本,包括英语和西班牙语,其中我们使用了语言特征,混合损失,多任务目标和令牌级合成策略以提高 Named Entity Recognition 的性能,使用基于字典的模糊和语义搜索来执行实体标准化, 最后,我们的 Relation Extraction 系统使用带语言特征的 Support Vector Machine,并在相关任务上表现出色。
Oct, 2019
在无监督环境下,我们探讨了从自由文本中提取命名实体之间关系的方法。除了标准特征提取外,我们还开发了一种重新加权词嵌入的新方法。我们使用单个特征降维缓解了特征稀疏性问题。我们的方法在 NYT-FB 数据集上获得了 F1-score 为 0.416 的显着提高,优于现有技术水平 5.8%。
Jan, 2018