BriefGPT.xyz
Ask
alpha
关键词
representation entropy
搜索结果 - 1
大型语言模型几何信息
该研究探讨了大型语言模型(LLMs)中嵌入的信息编码,并发现与模型大小存在幂律关系的表示熵。基于此观察,提出了一个基于(条件)熵的理论以阐明该缩放定律现象。此外,通过使用信息论和回归技术,研究 LLMs 的自回归结构,并检查最后一个标记与前
→
PDF
5 months ago
Prev
Next