Dec, 2023

精调语言模型的权重中编码了时间

TL;DR我们提出了时间向量,这是一种在新的时期自定义语言模型的简单工具。时间向量通过在单个时间段(例如一年或一个月)的数据上对语言模型进行微调,然后减去原预训练模型的权重来创建。我们的实验结果表明,这个向量指定了在权重空间中的一个方向,在该时间段的文本上可以提高性能。在连续的时间段上定制的时间向量似乎在流形中靠得更近。利用这个结构,我们可以在时间向量之间插值,从而产生在介入和未来时间段上表现更好的新模型,而无需进行额外的训练。我们的研究结果表明,时间被编码在微调模型的权重空间中。