本文提出了第一个神经网络端到端实体链接系统,通过学习文本中所有可能识别结果的上下文相似性得分,实现了提及检测和实体歧义消解的联合(Entity Linking)算法,方法不需要其他工程特定特征,且在足够的训练数据情况下优于市场已有系统,在测试数据集与训练集不同(如问询 / 推文和新闻文档)时,我们的模型与传统命名实体识别系统耦合可提供最好或次优的 EL 准确性。
Aug, 2018
本文介绍了一种受 Stack-LSTM 启发的模型,利用命名实体识别和实体链接的相关性进行联合学习,从而在 NER 和 EL 两个任务中获得更强的性能,并取得了竞争性的最新成果。
Jul, 2019
实体链接是将文本提及与相应实体连接的计算过程。本论文通过开发多个系统,证明了即使资源有限,也可以构建在多种语言中运作的竞争性神经网络实体链接系统,从而使实体链接更容易接近。
May, 2024
通过引入新的 $k$NN-BioEL 方案,以及使用动态难负采样 (DHNS) 进行对比学习,本研究提出了一种改进型的生物医学实体链接模型,可以提高模型对稀有和困难实体的处理能力,并在多个数据集上优于现有方法。
Dec, 2023
提出了一种针对获取增强型开放领域问答系统的端到端可区分训练方法,它结合多个已检索文件的信息来生成答案,通过期望最大化算法的近似计算来建模检索决策,证明了该方法优于现有同类方法,达到了新的最高水平。
Jun, 2021
本文提出了一种基于神经元的端到端模型来联合提取实体和它们的关系,该模型不依赖于外部自然语言处理工具,而是集成了大量的预训练语言模型, 在三个领域的五个数据集上,我们的模型可以与最先进的性能相提并论,有时甚至具有更高的性能。
Dec, 2019
通过使用 Retrieval as Attention (ReAtt) 和 Transformer,我们的研究表明,通过端到端的培训,单个模型可以同时实现有竞争力的提取和问答表现,在监督和无监督的设置中显著提高其在超领域数据集上的性能。
Dec, 2022
本文介绍了 LIEL,一种语言无关的实体链接系统,通过使用区分重排框架和许多不受领域和语言限制的特征函数,它可以在多种不同的语言中工作。在各种基准数据集上的实验表明,该系统在英语上表现出色,在训练过英语的情况下,也可以很好地工作在西班牙语上,这证明了该方法的可行性。
Dec, 2017
ELQ 是一种快速的端到端实体链接模型,使用双编码器同时执行提及检测和链接,可用于提高下游问题回答系统的性能。
Oct, 2020
提出了一种名为 EER 的新方法,该方法通过改进传统 EBR 的双编码器模型、引入对比学习和生成式事件三元组提取方案,以及相关学习实现事件关联查询编码器优化,提高了实时检索性能,有望为信息检索领域带来新的视角。
Apr, 2024