EMNLPOct, 2022

利用词汇语义变化提高预训练语言模型的时间泛化能力

TL;DR本论文提出了一种基于词汇层面 masking 的后训练策略,以此来解决大规模神经语言模型在时间通用性方面存在的问题,实验证明该方法在两个预训练语言模型、两种不同分类任务和四个基准数据集上效果优于现有的连续训练策略。