Sep, 2024

UniSumEval:迈向统一的、细粒度的、多维度的摘要评估

TL;DR本研究解决了现有摘要质量评估基准在输入场景多样性、维度定义狭窄以及主观注释不精准等方面的不足。通过创建UniSumEval基准,本文提出了一种新的方法,拓宽了输入上下文范围并提供了细粒度、多维度的注释,显著提升了对最新语言模型摘要性能的评估效果。本研究的成果将为未来的摘要评估提供更全面的参考。