Mar, 2023
ChatGPT 还是 Grammarly?评估 ChatGPT 在语法错误更正基准上的性能
ChatGPT or Grammarly? Evaluating ChatGPT on Grammatical Error Correction Benchmark
Haoran Wu, Wenxuan Wang, Yuxuan Wan, Wenxiang Jiao, Michael Lyu
TL;DR本文评估了 AI 语言模型 ChatGPT 在语法纠错任务上的表现,通过与 Grammarly 和 GECToR 等商业和先进模型比较,发现 ChatGPT 在自动评估指标上表现较弱,但经过人工评估,发现 ChatGPT 更倾向于修改某些短语或句子结构而仍保持语法正确性,这表明自动评估指标低估了 ChatGPT 工具的潜力。