Jun, 2022

SC-Ques: 为英语作为第二语言学习者设计的句子填空问题数据集

TL;DR本文介绍了一个大规模的英语作为第二语言句子填空(SC)数据集,名为 SC-Ques,由 292,517 个真实世界中标准化英语考试中的 SC 问题组成。除此数据集外,基于该数据集,建立了一个综合性评测模型,通过训练大规模预训练语言模型自动解决 SC 问题。文中对基线模型的性能、限制和权衡进行了详细的分析。