Feb, 2021

Mind the Gap: 评估神经语言模型的时间泛化能力

TL;DR研究表明,Transformer-XL 语言模型在预测超出其训练期的未来话语时,性能会随着时间的推移而逐渐降低。基于此,提出了动态语言建模的思路,并通过不断更新知识来缓解性能退化问题。因此,应重新思考我们目前培训和评估语言模型的方法,并发展出适应我们日益变化和非稳定的世界的自适应语言模型。