ACLJul, 2024

FineSurE: 利用 LLMs 进行细粒度总结评估

TL;DR利用大型语言模型 FineSurE,我们针对文本摘要任务提出了一种细粒度评估方法,该方法在完成度、简洁度和忠实度等多个维度上对摘要性能进行评估,并在各种开源和专有的大型语言模型作为 FineSurE 的基础上进行了广泛的基准测试,改进了摘要性能。