EMNLPOct, 2022

对话摘要中忠实度的分析和评估

TL;DR本文提出了一种系统评估对话摘要的方法,并通过人工分析发现现有模型中有超过 35% 生成的摘要与原始对话不符,其评估工具与样本数据可用于未来的研究。