EMNLPNov, 2023

词汇重复导致机械记忆:揭示训练和测试参考摘要中词汇重叠的影响

TL;DR理想的摘要模型应该能推广到新的值得摘要的内容,而不需要死记参考训练摘要,我们提出了一种细粒度的评估协议,通过基于参考测试摘要与训练摘要之间的词汇相似性将测试集划分,限制训练摘要中的词汇重复能够防止死记硬背,并提高摘要模型的泛化性。