ACLFeb, 2017

JFLEG:一个流畅的语料库和语法错误修正基准

TL;DR我们提供了一个新的平行语料库,JHU FLuency-Extended GUG corpus (JFLEG),用于开发和评估对于语法错误校对 (GEC)。该语料库不仅涵盖了不同语言熟练程度,而且还使用了整体流畅度编辑来更正语法错误,并使原始文本更加本地化。我们描述了所做的更正类型,并在此数据集上对四个领先的 GEC 系统进行了基准测试,确定了它们表现良好的特定领域以及如何改进。JFLEG 满足了对新的黄金标准的需求,以便正确评估当前 GEC 的状况。