BriefGPT.xyz
Ask
alpha
关键词
model quantification
搜索结果 - 1
OneBit: 极低位大型语言模型
该研究使用 1 位量化来减少高度期望的低精度模型的存储和计算开销,并通过引入一种 1 位量化感知训练框架 OneBit 以及基于矩阵分解的参数初始化方法来实现良好的性能(至少达到非量化性能的 83%)。
PDF
5 months ago
Prev
Next