May, 2023

TempoSum:评估抽象化摘要的时间泛化能力

TL;DR本文研究了文本摘要模型的时态泛化能力和忠实度,并提出了新的基准测试集 TempoSum,对不同时间段的数据进行测试,发现现有的基准测试集可能依赖于事先的知识,不具有泛化能力,并且现有的忠实度提升方法对未来数据的忠实度提升是不可靠的。