Nov, 2023

大型语言模型隐式学习将神经句子轨迹纠正为自然语言的预测性表示

TL;DR用于预测的自回归变换器的预测表示通过逐渐变得更加直线化来实现更好的语言建模性能,并与句子的惊异程度之间存在一致的关系。