Jun, 2021

评估实体消歧和流行度在检索导向的自然语言处理中的作用

TL;DR为了评估检索器的实体消歧能力,我们提出了一种评估基准(AmbER)集。我们在这项研究中使用AmbER集为三种流行的开放域任务创建和评估检索器,并发现检索器存在受欢迎程度偏差,对于名称下不那么流行的实体的检索性能明显下降。AmbER集显示其作为评估工具的实用性,并强调了流行检索系统的弱点。