BriefGPT.xyz
Ask
alpha
关键词
trajectory straightening hypothesis
搜索结果 - 1
大型语言模型隐式学习将神经句子轨迹纠正为自然语言的预测性表示
用于预测的自回归变换器的预测表示通过逐渐变得更加直线化来实现更好的语言建模性能,并与句子的惊异程度之间存在一致的关系。
PDF
8 months ago
Prev
Next