SpEL：结构化实体链接的预测

Oct, 2023

SpEL: Structured Prediction for Entity Linking

Hassan S. Shavarani, Anoop Sarkar

TL;DR该研究介绍了使用结构化预测进行实体链接的方法，提出了一种名为 SpEL 的实体链接系统，通过细化的微调步骤、上下文敏感的预测聚合策略以及减小模型输出词汇量等新思路，在实体链接任务中取得了比现有方法更好的性能，并且在计算效率方面表现出色。

Abstract

entity linking is a prominent thread of research focused on structured data creation by linking spans of text to an ontology or knowledge source. We revisit the use of structured prediction for →

entity linking structured prediction spel fine-tuning aida benchmark dataset

发现论文，激发创造

通往语言无关的命名实体链接之路

本文介绍了 LIEL，一种语言无关的实体链接系统，通过使用区分重排框架和许多不受领域和语言限制的特征函数，它可以在多种不同的语言中工作。在各种基准数据集上的实验表明，该系统在英语上表现出色，在训练过英语的情况下，也可以很好地工作在西班牙语上，这证明了该方法的可行性。

Dec, 2017

职场领域的实体链接

本文首次探索在职业技能与 ESCO 分类之间进行实体链接，使用高效的神经模型（双编码器和自回归模型）进行技能链接的实证研究。

Jan, 2024

ChatEL: 与聊天机器人进行的实体链接

ChatEL 是一个三步骤的框架，用于指示 LLMs 返回准确结果，能够提高 10 个数据集的平均 F1 性能超过 2％。

Feb, 2024

TempEL：连接动态演变和新出现的实体

本文介绍了一个新的实体链接 (TempEL) 数据集，可以量化当前最先进的 EL 模型在知识库描述和提及环境中发生时间变化的实体上的性能表现以及那些以前不存在的新实体的实体链接性能，并发现 (在 temporal snapshots 中) 不断存在的实体在 EL 精度方面下降了 3.1％，而新实体的下降高达 17.9％，这强调了时间演变实体消岐的面临的挑战和新的研究前景。

Feb, 2023

SpanNER: 命名实体重新识别 / 识别作为跨度预测

本文研究了使用 span prediction 和 sequence labeling 框架进行命名实体识别的优缺点，并提出了系统组合的方法来重新识别来自不同系统的命名实体，并在 11 个数据集上进行了 154 个系统的实验，证明了 span prediction 也可以作为基础 NER 系统和系统组合器，同时也将我们的模型部署到 ExplainaBoard 平台上。

Jun, 2021

端到端的神经实体链接

本文提出了第一个神经网络端到端实体链接系统，通过学习文本中所有可能识别结果的上下文相似性得分，实现了提及检测和实体歧义消解的联合（Entity Linking）算法，方法不需要其他工程特定特征，且在足够的训练数据情况下优于市场已有系统，在测试数据集与训练集不同（如问询 / 推文和新闻文档）时，我们的模型与传统命名实体识别系统耦合可提供最好或次优的 EL 准确性。

Aug, 2018

学习联合查询解释和响应排序

利用保留非结构化文本语料的数据表征和结构化注释，我们提出了两种新的联合查询解释和响应排序的公式，既考虑了查询解释的不确定性，又将信息从知识库和语料库之间进行双向流动，这在实体搜索中表现出更高的精度。

Dec, 2012

用于实体发现和链接的神经网络模型

本论文描述了 USTC_NELSLIP 系统，在 2016 年 TAC 知识库填充 (KBP) 竞赛中提交的 Trilingual Entity Detection and Linking (EDL) 赛道，使用了两种方法进行实体发现和提及检测 (即使用条件 RNNLM 和基于注意力的编码器解码器框架)，将实体链接 (EL) 系统分为两个模块：基于规则的候选生成和神经网络概率排名模型。此外，还使用一些简单的字符串匹配规则进行 NIL 聚类，在结束时，我们的最佳系统在整个类型提及 CEAF 加度量中取得了 0.624 的 F1 值。

Nov, 2016

基于深度学习的实体链接模型综述

综述了自 2015 年以来，神经实体链接 (EL) 系统的最新发展，目的是系统化神经实体链接系统的设计特征，并将其性能与常见基准测试中的经典方法进行比较。该文从候选生成、提及 - 上下文编码和实体排名等方面讨论了神经 EL 系统的通用架构，总结了每个方法的突出特点。

May, 2020

短社交媒体文本中实体链接的强韧候选生成

研究了 Tweet 领域中实体链接方法的挑战，提出了一种使用来自维基百科的长上下文表示的混合解决方案，经过实验评估和比较，取得了 0.93 的召回率。

Oct, 2022