EMNLPOct, 2018

中文机器阅读理解的跨度抽取数据集

TL;DR本文介绍了一个针对中文机器阅读理解的 Span-Extraction 数据集及其挑战集,共包含近 20,000 个人类专家在维基百科段落中标注的真实问题,并发布了 CMRC 2018 的评估工作坊,旨在进一步推进中文机器阅读理解研究。