ACLJun, 2019

SherLIiC: 一个基于类型和事件的词汇推理基准,用于评估自然语言推理

TL;DRSherLIiC 是一个词汇推理上下文测试平台,由包含 3985 个手动注释的推理规则候选项(InfCands),包括~960k 未标记的 InfCands 和~190k 从大型实体链接语料库 ClueWeb09 中提取的 Freebase 实体间的类型文本关系。该平台对现有自然语言推理系统构成了颇具挑战性的考验。