Nov, 2023

通过多任务训练和优化训练计划实现高效的语法错误校正

TL;DR本研究通过使用辅助任务和优化训练顺序,针对神经语法错误校正的问题,提出了一种高效利用数据的方法,利用较小规模的基于BART模型(400M参数)的结果优于基于T5-XXL模型(11B参数)的最佳模型。