BriefGPT.xyz
大模型
Ask
alpha
关键词
ptq
搜索结果 - 3
CVPR
PTQ4SAM:用于分段任意物体的训练后量化
在这篇论文中,我们提出了一种针对 Segment Anything Model 的后训练量化框架,即 PTQ4SAM。我们通过分析 SAM 量化中的双峰分布特性,提出了双峰积分策略,并采用适应性颗粒度量化方法来处理 SAM 中的后 Soft
→
PDF
2 months ago
QuIP#: 通过哈达玛不相干和格码书更好地 LLM 量化
在这项研究中,我们引入了权重量化的新方法(QuIP#),通过三个创新技术,在极端压缩模式下(每个权重≤4 位)实现了最先进的结果。QuIP# 通过使用随机哈达玛变换改进 QuIP 的不相干处理,并利用具有不相干权重的球形亚高斯分布来使用向量
→
PDF
5 months ago
BRECQ: 通过块重构推动后训练量化的极限
本文介绍了一种名为 BRECQ 的新型 PTQ 框架,通过重构神经网络的组件来将 PTQ 的位宽降至 INT2,并将混合精度技术结合到框架中。对多种手工制作和搜索的神经体系结构进行了广泛的实验,证明了 PTQ 可以实现比使用 QAT 的 4
→
PDF
3 years ago
Prev
Next