EMNLPOct, 2020

通过不确定性理解神经网络抽象摘要模型

TL;DR通过对两个已预训练模型 PEGASUS 和 BART 进行分析,本文探讨了在两个文本摘要数据集上,token-level 预测的不确定性与模型规律的关系,发现模型在复制标记而非生成新文本的情况下,预测熵值较小;同时,不确定性与句子位置、相邻标记之间的语法距离等因素有关,并阐述了注意力机制对模型效果的影响。