ACLApr, 2024

时间机器 GPT

TL;DR大型语言模型(LLMs)通常在广泛的、时间不加区分的文本语料库上进行训练,反映了缺乏带有时间元数据的数据集。本文提出了一种新的方法:一系列时间点的 LLMs,称为 Time Machine GPT(TiMaGPT),专门设计为非预测性的。这确保它们对未来的事实信息和语言变化保持不知情,这种策略对于理解语言的演化以及在动态环境下应用模型(如时间序列预测)尤为重要。我们提供模型和训练数据集的访问权限。