BriefGPT.xyz
Ask
alpha
关键词
1-bit quantization
搜索结果 - 2
OneBit: 极低位大型语言模型
该研究使用 1 位量化来减少高度期望的低精度模型的存储和计算开销,并通过引入一种 1 位量化感知训练框架 OneBit 以及基于矩阵分解的参数初始化方法来实现良好的性能(至少达到非量化性能的 83%)。
PDF
5 months ago
Moniqua:分布式 SGD 中的模量量化通信
本文提出了 Moniqua 技术,它允许分散式的 SGD 使用量化通信,在不降低精度的前提下,每次迭代只需要传输一定数量的信息。此技术不需要额外内存,可适用于多种去中心化算法,并且在实验中已经证明了相对于其他量化去中心化算法更快的收敛速度,
→
PDF
4 years ago
Prev
Next