EMNLPOct, 2022

FCGEC: 中文精细化语法纠错语料库

TL;DR本文提出了 FCGEC,它是一个多引用的细粒度中文语法错误检测、识别和纠正语料库,以及一个用于低资源环境下纠正语法错误的 Switch-Tagger-Generator(STG)基准模型,实验结果表明 STG 在 FCGEC 上的表现优于其他 GEC 基准模型,同时也揭示出基准模型和人类之间存在显著差距,鼓励未来的模型通过桥接填补这一差距。