关系抽取文档覆盖率预测
该文介绍了一种文本挖掘框架,利用 Named Entity Recognition 和 Relation Extraction 模型对医学文献和数字临床记录进行处理,取得优异的实验结果,并构建了一个生物医学知识图谱。系统使用 Spark NLP 库提供的生产级、可伸缩、硬件优化、可训练和可调整的 NLP 框架。
Dec, 2021
我们提出了一种关系图方法,用于明确利用关系之间的相互依赖性,在文档级别关系抽取中考虑关系的相互关联,并通过关系图模型化关系之间的相关性,以及通过关系信息传播的关系相关矩阵的重要性。实验结果验证了我们的方法可以提高多关系抽取的性能,在文档级别关系抽取中考虑关系的相互关联的有效性。
Oct, 2023
本研究提出基于 Entity-level Relation Matrix 与 U-shaped Network 的 Document-level Relation Extraction 模型,通过结合上下文信息以及全局关系,实现了在 DocRED,CDR 和 GDA 三个基准数据集上的最优性能。
Jun, 2021
本论文提出基于实体的文档上下文过滤来构建输入并基于跨路径实体关系注意力的交叉文档关系提取模型,与现有方法比较,在 CodRED 数据集上取得至少 10% 的 F1 值的提升,从而展示其在跨文档关系提取中的有效性。
Oct, 2022
本文针对文档级关系抽取领域中广泛存在的一种强假设,即所有命名实体都已经完美地本地化、标准化和分类,通过构造四种类型的实体提及攻击,对典型的文档级关系提取模型进行行为探测,发现大多数当前的文档级关系提取模型易受实体提及攻击的影响,难以在真实世界的自然语言处理应用中部署,在未来的研究中建议停止简化问题设置,并在真实环境下建模文档级关系提取。
Jun, 2023
本文介绍了关系抽取(RE)的若干重要的监督、半监督和无监督技术,以及开放信息抽取(OIE)和远程监督的范例,最后描述了近期 RE 技术和未来研究方向。这篇综述对于领域的新手、研究人员和实践者都有用。
Dec, 2017
在无监督环境下,我们探讨了从自由文本中提取命名实体之间关系的方法。除了标准特征提取外,我们还开发了一种重新加权词嵌入的新方法。我们使用单个特征降维缓解了特征稀疏性问题。我们的方法在 NYT-FB 数据集上获得了 F1-score 为 0.416 的显着提高,优于现有技术水平 5.8%。
Jan, 2018