May, 2023

成功与失败之间的舞蹈:使用SALSA进行编辑层次简化评估

TL;DR研究了基于大型语言模型的文本简化方法,提出了一种人工评估框架 SALSA,并使用该框架进行了细致的简化质量评估,发现 GPT-3.5 可以比人类更优秀的进行简化但仍存在错误;同时,提出了一种基于编辑注释的自动评估方法 LENS-SALSA,并报告了良好的初步结果。