Mar, 2024

人非圣贤,驼群亦可学

TL;DR该研究通过利用语言模型的人工错误生成(AEG)来增强语法错误校正(GEC),发现通过对基于 Llama 2 的语言模型进行微调,可以生成与人类错误相似的合成错误,进一步训练 GEC Llama 模型,使其在已测试的多种语言(德语、乌克兰语和爱沙尼亚语)中的校正效果超过了先前的最先进错误校正模型,并且证明了通过微调较小的序列到序列模型和提示大型商业语言模型(GPT-3.5 和 GPT-4)而生成的错误也对错误生成模型产生有益影响。