COLINGNov, 2020

评估测量经常在低分数范围内出现分歧:重新审视摘要评估测量指标

TL;DR本文讨论了人工评价与自动评价在文本摘要中的应用,并提出了评价指标间的差异和相关性。研究发现评价指标的互相协议性取决于摘要的得分范围、摘要易于摘要的程度、摘要抽象程度和覆盖范围等方面。