Feb, 2024

Alirector:对齐增强的中文语法错误修正器

TL;DR本文提出了一种用于解决过度更正问题的对齐增强纠错模型,适用于序列到序列模型和仅具有解码器的大型语言模型。该方法通过训练纠错模型生成源句子的初始纠错,并将其与源句子结合,经过对齐模型进行另一轮纠错,以确保对齐模型专注于潜在的过度更正。此外,为了增强模型识别微妙差别的能力,我们还探索了源句子和初始纠错的反向对齐。最后,我们将两个对齐模型的对齐知识传递给纠错模型,指导其避免过度更正。在三个中文语法错误纠正数据集上的实验结果表明,我们的方法在减轻过度更正和提高整体性能方面是有效的。