Dec, 2019
CJRC: 一个可靠的人工标注中文司法阅读理解基准数据集
CJRC: A Reliable Human-Annotated Benchmark DataSet for Chinese Judicial Reading Comprehension
Xingyi Duan, Baoxin Wang, Ziyue Wang, Wentao Ma, Yiming Cui...
TL;DR本研究介绍了一个含有近 10K 文档和近 50K 个问题及其答案的中国司法阅读理解 (CJRC) 数据集,基于 Bert 和 BiDAF 构建了两个强基准模型,实验结果显示与人工标注员的表现相比仍有进步的空间。该数据集可用于司法领域中元素提取的机器阅读理解技术研究。