ELEVANT:一款全自动细粒度实体链接评估和分析工具
提出了一种新的、多语言的、基于知识的、不可知的和确定性的实体链接方法,称为MAG,它是基于结构化知识库和图形算法的上下文检索的组合。通过在 23 个数据集和 7 种语言上评估 MAG,证明其在英语数据集上获得了最先进的性能,并在其他语言上取得与 PBOH 相比高出至多 0.6 的 micro F-measure。
Jul, 2017
在这项工作中,我们提出了EntEval:一个测试套件,用于评估实体表示的整体质量,并通过使用维基百科中的自然超链接注释开发了学习更好的实体表示的培训技术,通过有效目标的检测, 显示这些目标可以改善多个EntEval任务上的强基线。
Aug, 2019
本文提出了一种名为REL的Python包和网络API,它是一种具有模块化架构、使用最先进的自然语言处理研究的神经组件、不依赖外部来源、可轻松更新到较新的维基百科版本并具有最先进的性能的单一系统来填补现有工具的缺口。作者还在标准的实体链接基准测试上进行了实验比较。
Jun, 2020
使用 ShadowLink 数据集评估实体链接 (EL) 系统的性能,结果显示先验概率偏差和实体遮蔽对较常见实体和较少见实体的准确性都有很大影响。
Aug, 2021
本文提出了未知实体发现与索引(EDIN)基准测试方法,并基于稠密检索实体链接技术提出了端到端的EDIN流程,以检测、聚类和索引上下文中的未知实体,实验结果显示,将每个实体的嵌入整合起来得到单个嵌入的方法优于独立检索每个提及。
May, 2022
本研究介绍了 ReFinED:一个高效的实体链接模型,使用细粒度实体类型和实体描述执行链接。该模型执行单向传递,可在文档中对所有提及进行提及检测、细粒度实体类型划分和实体消歧,使其比竞争性现有方法快60倍以上。ReFinED 在标准实体链接数据集上的性能优于最先进性能平均提高了3.7个F1,具有良好的泛化能力和零-shot实体链接。该研究的组合可获得速度,精确性和规模,因此是从网络规模数据集中提取实体的一种有效和成本效益的系统。
Jul, 2022
该研究提出了一种新的实体链接方法,利用Transformers构建密集表示并考虑了NIL实体情况,通过产生相应的提及聚类同时保持良好的实体链接表现,该方法以NILK数据集为基础进行了评估并在维基百科列表中的实体链接任务中进行了应用和分析。
Mar, 2023
本文针对实体链接系统的评估存在的问题,提出了更具意义和公正的方法,通过多个广泛使用的基准测试和两个新的基准测试,评估了多种现有的端到端实体链接器的强弱点及其可重复性。
May, 2023
通过引入一个黑盒子基准,并对所有最先进的实体链接方法进行全面评估,本文解决了近年来实体链接系统发展中缺乏统一框架的问题。研究发现实体链接系统对候选集的依赖性及其对各个系统的普适性的限制,提出了一种替代候选集的方法,并展示了某些模型在更宽松的候选集、增加推理时间和内存占用之间的权衡关系。
Apr, 2024