COLINGApr, 2021

后处理对上下文化词表示的影响

TL;DR本篇论文探讨了对预训练语言模型中的上下文嵌入层进行后处理的实用性,进一步应用标准化个体神经元激活层、单位长度标准化等方法,发现这些方法能够揭示嵌入层中的重要信息,包括词汇任务和序列分类任务。文章提出了 z-score 标准化作为使用这些方法的一个重要步骤。