Nov, 2016

MS MARCO:人类生成的机器阅读理解数据集

TL;DR介绍了一个大规模的机器阅读理解数据集 MS MARCO,由真实用户的查询日志中提取了 1010916 个问题和 8881823 个网页文本,并提供了三个任务用于评估及基准测试,即根据一些上下文语境回答问题、生成可理解的答案和给定问题评分。