Nov, 2022
未来不同:大型预训练语言模型在预测任务中失效
The future is different: Large pre-trained language models fail in
prediction tasks
TL;DR本文介绍了四个 Reddit 数据集,探讨了预训练语言模型在数据分布面临渐变时的性能问题,并提出了一种基于神经变分动态主题模型和注意力机制的简单方法来预测未来文章的流行度,其性能表现比预训练语言模型的性能下降少,提供实际事件的可解释性表示,如 GameStop 的空头攻击。