Sep, 2022

如何找到强的摘要连贯性度量?用于摘要连贯性度量评估的工具箱和比较研究

TL;DR本文介绍了自动评估摘要连贯性的意义,通过介绍不同的模型来建立摘要连贯性,并且引入了两种新的分析度量,即内部系统相关性和偏差矩阵,利用它们可以识别出一些偏见,并提供对系统级混淆的鲁棒性。虽然目前可用的自动连贯度量不能对所有评价指标的系统摘要分配可靠的连贯度得分,但是大型自然语言模型在自我监督任务上进行微调,表现出良好的结果,只要微调考虑到它们需要跨不同的摘要长度进行泛化即可。