提出一种基于 BERT 预训练和实体相似度分数的实体链接模型,通过注入潜在的类型信息到实体嵌入中,并结合一种基于 BERT 的实体相似度分数,显著提高了实体链接模型的性能。
Jan, 2020
提出一种无需实体级别监督的实体链接和关系抽取模型,避免了流水线方法中产生的级联错误,并在两个生物医学数据集上优于最先进的实体链接和关系抽取流水线,极大地提高了系统的总体召回率。
Dec, 2019
本研究提出一种基于未标记的自然文本和维基百科的无监督学习方法,探索实体链接,使用潜在变量的主题模型学习本地语境和文档中其他实体的相互衔接,结果表明该方法优于现有的有监督的系统,应该是一种普遍适用于自然语言处理领域的方法。
Jun, 2019
该研究提出了一种基于聚类的推理模型,可以在生物医药领域的文本中实现实体链接,将多个提及归为一组,有望提高独立预测精度。
Oct, 2020
综述了自 2015 年以来,神经实体链接 (EL) 系统的最新发展,目的是系统化神经实体链接系统的设计特征,并将其性能与常见基准测试中的经典方法进行比较。该文从候选生成、提及 - 上下文编码和实体排名等方面讨论了神经 EL 系统的通用架构,总结了每个方法的突出特点。
May, 2020
本研究提出一种基于强化学习的方法,将实体链接转换为序列决策问题,全局考虑前面提及的实体,并探索当前选择对后续决策的长期影响,实验证明该模型比现有系统表现更好且具有更好的泛化性能。
Feb, 2019
提出了一种基于最近邻法的实体链接方法,该方法通过建立一个上下文相关的提及编码器,学习将相似的提及放置在比不同实体的提及更接近的向量空间中,从而利用所有实体的提及作为 “类原型”,通过对训练集中标记的实体的提及集合进行检索,并应用最近的提及邻居实体标签进行推理。通过对维基百科超链接的提及对的大型多语言语料库进行训练,该模型在一个包含 7 亿个提及的索引上进行最近邻推理。该方法训练简单,预测可解释性更强,并在两个多语言实体链接基准测试中优于所有其他现有方法。
Jun, 2021
本文提出了一种新颖的端到端循环神经模型,结合了实体感知的注意力机制和潜在实体类型(LET)方法,以解决语义关系分类任务中现有模型对高级语义和句法特征的过度依赖和未充分利用实体信息等问题。在 SemEval-2010 任务 8 上的实验结果表明,该模型在无需高级特征的情况下胜过现有最先进的模型。
Jan, 2019
本文试图通过利用微博中的社交网络结构,将作者、提及和实体编码成一个连续向量空间,并将这些向量纳入神经结构预测模型中,以捕捉实体链接任务中固有的结构约束。与现有的最新技术相比,这些设计决策在基准数据集上的 F1 值提高了 1%-5%。
Sep, 2016
本文介绍了一种用于解决生物医学领域实体链接问题的模型 LATTE,该模型通过建模提及和实体的潜在类型信息来提高实体链接的性能,并且在 MedMentions 数据集和医生笔记语料库上取得了显著的表现提升。
Nov, 2019