BriefGPT.xyz
大模型
Ask
alpha
关键词
1-bit transformer architecture
搜索结果 - 1
BitNet:面向大型语言模型的 1 比特 Transformer 的扩展
BitNet 是一种可扩展且稳定的 1 位 Transformer 架构,用于大型语言模型,通过引入 BitLinear 作为 nn.Linear 层的替代方案,BitNet 可以从零开始训练 1 位权重,实验结果表明,与最先进的 8 位量
→
PDF
9 months ago
Prev
Next