SpEL:结构化实体链接的预测
本文介绍了 LIEL,一种语言无关的实体链接系统,通过使用区分重排框架和许多不受领域和语言限制的特征函数,它可以在多种不同的语言中工作。在各种基准数据集上的实验表明,该系统在英语上表现出色,在训练过英语的情况下,也可以很好地工作在西班牙语上,这证明了该方法的可行性。
Dec, 2017
本文介绍了一个新的实体链接 (TempEL) 数据集,可以量化当前最先进的 EL 模型在知识库描述和提及环境中发生时间变化的实体上的性能表现以及那些以前不存在的新实体的实体链接性能,并发现 (在 temporal snapshots 中) 不断存在的实体在 EL 精度方面下降了 3.1%,而新实体的下降高达 17.9%,这强调了时间演变实体消岐的面临的挑战和新的研究前景。
Feb, 2023
本文研究了使用 span prediction 和 sequence labeling 框架进行命名实体识别的优缺点,并提出了系统组合的方法来重新识别来自不同系统的命名实体,并在 11 个数据集上进行了 154 个系统的实验,证明了 span prediction 也可以作为基础 NER 系统和系统组合器,同时也将我们的模型部署到 ExplainaBoard 平台上。
Jun, 2021
本文提出了第一个神经网络端到端实体链接系统,通过学习文本中所有可能识别结果的上下文相似性得分,实现了提及检测和实体歧义消解的联合(Entity Linking)算法,方法不需要其他工程特定特征,且在足够的训练数据情况下优于市场已有系统,在测试数据集与训练集不同(如问询 / 推文和新闻文档)时,我们的模型与传统命名实体识别系统耦合可提供最好或次优的 EL 准确性。
Aug, 2018
利用保留非结构化文本语料的数据表征和结构化注释,我们提出了两种新的联合查询解释和响应排序的公式,既考虑了查询解释的不确定性,又将信息从知识库和语料库之间进行双向流动,这在实体搜索中表现出更高的精度。
Dec, 2012
本论文描述了 USTC_NELSLIP 系统,在 2016 年 TAC 知识库填充 (KBP) 竞赛中提交的 Trilingual Entity Detection and Linking (EDL) 赛道,使用了两种方法进行实体发现和提及检测 (即使用 条件 RNNLM 和基于注意力的编码器解码器框架),将实体链接 (EL) 系统分为两个模块:基于规则的候选生成和神经网络概率排名模型。此外,还使用一些简单的字符串匹配规则进行 NIL 聚类,在结束时,我们的最佳系统在整个类型提及 CEAF 加度量中取得了 0.624 的 F1 值。
Nov, 2016
综述了自 2015 年以来,神经实体链接 (EL) 系统的最新发展,目的是系统化神经实体链接系统的设计特征,并将其性能与常见基准测试中的经典方法进行比较。该文从候选生成、提及 - 上下文编码和实体排名等方面讨论了神经 EL 系统的通用架构,总结了每个方法的突出特点。
May, 2020
研究了 Tweet 领域中实体链接方法的挑战,提出了一种使用来自维基百科的长上下文表示的混合解决方案,经过实验评估和比较,取得了 0.93 的召回率。
Oct, 2022