May, 2024

基于有机数据驱动的土耳其语语法错误修正与 LLMs

TL;DR使用有机数据驱动的方法,通过插入文本,并通过清理用于进行训练的数据,构建土耳其语语法错误校正数据集,并在两个土耳其语语法错误校正测试集上达到最新的成果,同时证明了该方法在训练语言模型时的有效性。