Sep, 2019

用于语法错误校正的可控数据合成方法

TL;DR提出两种数据合成方法来解决语法错误纠正任务中缺乏平行数据的问题,并对不同数据进行实验,结果表明错误率为 40%,错误类型的比例相同可以更好地提高模型性能。最终,合成约 1 亿数据,实现了与使用两倍数据的最新技术相当的性能。