ACLJun, 2021

MOLEMAN: 基于实体提及注释网络的实体提及链接

TL;DR提出了一种基于最近邻法的实体链接方法,该方法通过建立一个上下文相关的提及编码器,学习将相似的提及放置在比不同实体的提及更接近的向量空间中,从而利用所有实体的提及作为 “类原型”,通过对训练集中标记的实体的提及集合进行检索,并应用最近的提及邻居实体标签进行推理。通过对维基百科超链接的提及对的大型多语言语料库进行训练,该模型在一个包含 7 亿个提及的索引上进行最近邻推理。该方法训练简单,预测可解释性更强,并在两个多语言实体链接基准测试中优于所有其他现有方法。