BriefGPT.xyz
Ask
alpha
关键词
time directionality
搜索结果 - 1
大型语言模型的时间箭头
我们通过时间方向性的角度研究自回归大规模语言模型的概率建模,经验性发现这类模型在自然语言建模方面存在时间上的非对称性:在预测下一个标记和预测上一个标记时的平均对数困惑度存在差异。这种差异在多个模式(语言、模型大小、训练时间等)上既微妙又非常
→
PDF
5 months ago
Prev
Next