Nov, 2023
大型语言模型隐式学习将神经句子轨迹纠正为自然语言的预测性表示
Large language models implicitly learn to straighten neural sentence trajectories to construct a predictive representation of natural language
Eghbal A. Hosseini, Evelina Fedorenko
TL;DR用于预测的自回归变换器的预测表示通过逐渐变得更加直线化来实现更好的语言建模性能,并与句子的惊异程度之间存在一致的关系。