Aug, 2023

评估优秀的语法错误修正

TL;DR对瑞典学生文本进行全面评估,发现在少样本环境下,GPT-3明显优于之前瑞典语语法错误修正系统,同时发现当前评估方法存在不可取的偏见,建议采用人工编辑GEC系统的输出来分析达到本地人级别性能所需要的改变量,并提供一份包含人工编辑和语法性、流畅性和意义保持评估的数据集。