May, 2022

理解重述度量

TL;DR提出了一种新的度量方法 $ROUGE_P$ 来评估再表述的质量,并提供了证据表明当前自然语言生成度量标准不足以衡量好的再表述的期望属性。