Jul, 2017

Quasar: 通过搜索和阅读获取问题回答的数据集

TL;DR该研究提出了两个数据集,用于评估自然语言查询的理解和从大量文本语料库中提取答案的系统。Quasar-S 数据集由 37000 个填空式查询构成,Quasar-T 数据集由 43000 个开放领域的问答问题和它们的答案组成。我们将这些数据集作为事实型问题回答的两个相关子任务的挑战,并评估了几个基线模型,并显示它们在 Quasar-S 和 - T 方面落后于人类表现 16.4%和 32.1%。