EMNLPAug, 2016

谁做了什么:一个大规模的人以为中心的填空数据集

TL;DR本文介绍了一份新的 “谁做了什么” 数据集,其中包含了超过 200,000 个填空阅读理解问题,使用 LDC 英语千万字级新闻语料库构建。数据集具有多种新特性,例如使用两个独立的文章来形成问题,其中每个选项都是命名实体,问题已被筛选,以剔除人类可以轻松解决的问题。同时,对标准系统进行了性能基准测试,并将该数据集作为社区挑战任务提出。