May, 2018

通过核心实体显著性建模实现更好的文本理解和检索

TL;DR本文提出一种核实体显著性模型(KESM),通过更好地估计文档中实体的显著性(重要性),提高文本理解和检索。KESM 通过知识增强的分布式表示来表示实体,通过核函数建模实体和单词之间的交互,并结合核分数来估计实体显著性。该模型的整个过程都是通过学习实体显著性标签来完成的。显著性模型还通过模拟候选文档中查询实体的显著性,提供有效的排名特征,从而提高了即席搜索的准确性。我们在两个实体显著性语料库和两个 TREC 即席搜索数据集上的实验结果表明,KESM 比基于频率和特征的方法更为有效。我们还提供了示例,展示了 KESM 如何将其从实体显著性中学到的文本理解能力应用于搜索。