ACLMay, 2023

医学多文献摘要自动评估指标与人类评估不符

TL;DR为了改进文献综述的多文件摘要 (MDS),引入包含人工评估的摘要质量特征和成对偏好的数据集,以支持开发更好的自动评估方法,分析了自动摘要评估度量与生成的摘要词汇特征、其他自动度量以及人工评估摘要质量方面的相关性。发现自动化度量无法完全捕捉到人工评估所评估的质量方面。