EMNLPSep, 2020

小而强大:分裂和改写的新基准

TL;DR本文研究了将复杂句子简化为简单句子的文本简化任务,发现常用的基准数据集存在易被利用的语法线索,其自动生成过程中存在的固有偏差使其无法准确评估模型性能。通过收集众包数据,本文构建了更加多样化、接近人工写作的基准数据集,并提出了一套评估标准,初步证明了基于该基准数据集的人工评估更加精准和公正。