Jun, 2024

ChatLang-8: 基于 LLM 的语法错误修正合成数据生成框架

TL;DR我们探索和改进 LLM 的能力,以生成语法错误纠正(GEC)的数据,提出了一个自动化框架,并引入了一个名为 ChatLang-8 的新数据集,该数据集包含八种主题名词和 23 种语法类型,实验结果表明我们的框架和 ChatLang-8 对于提高 ChatGPT 的数据生成能力具有价值。