BriefGPT.xyz
Ask
alpha
关键词
quantization strategy
搜索结果 - 3
分布式 SGD 的截断非均匀量化
为了解决分布式学习中的通信瓶颈挑战,本研究引入了一种新的两阶段量化策略,旨在增强分布式随机梯度下降(SGD)的通信效率。通过截断来减轻长尾噪声的影响,随后根据梯度的统计特征进行非均匀量化。我们为量化的分布式 SGD 提供了全面的收敛性分析,
→
PDF
5 months ago
基于 Householder 量化的深度哈希
通过提出一种替代的量化策略,该论文通过在嵌入空间上进行相似性学习,并采用正交变换优化嵌入的每个坐标,然后通过符号函数将转换后的嵌入量化为二进制,从而提高了大规模图像相似性搜索的性能。
PDF
8 months ago
迈向端到端基于生成型大语言模型的 4 位推理
大多数大型生成模型的推理计算可以通过将权重和激活值均转换为 4 位来加速计算,同时保持良好的准确性;我们通过名为 QUIK 的混合量化策略实现这一目标,该策略将大多数权重和激活值压缩为 4 位,将一些异常值保留在较高精度;关键是,我们的方案
→
PDF
9 months ago
Prev
Next