Jun, 2018

DRCD:一个中文机器阅读理解数据集

TL;DR介绍 DRCD (Delta Reading Comprehension Dataset),这是一个面向开放领域的传统中文机器阅读理解数据集,包含来自 2,108 个维基百科文章的 10,014 段落和超过 30,000 个问题。我们构建了一个基准模型,其 F1 得分为 89.59%,人类表现的 F1 得分为 93.30%。