Feb, 2023

揭示未知:使用实体链接技术进行知识库外提及发现

TL;DR提出了基于 BERT 的实体链接方法 BLINKout,该方法结合了 NIL 表示、NIL 分类和同义词增强等多种技巧,能够识别没有对应知识库实体的提及,并通过本体修剪和版本控制等策略,从正常的知识库内实体链接数据集中构建出不在知识库内的提及。在 4 个医学本体数据集上的实验结果表明,BLINKout 方法在 UMLS 和 SNOMED CT 等医学本体的不在知识库内提及检测方面表现优异。