关键词post training quantization
搜索结果 - 3
- CVPR量化扩散变压器分析
通过分析扩散变换器中激活和权重量化的挑战,我们提出了一种单步采样校准激活和适应分组量化权重的低比特量化方法,从而在无需任何优化的情况下在纯变换器结构上实现了高效的后量化,我们通过初步的条件图像生成实验展示了所提出方法的效率和有效性。
- MixDQ: 高效节省内存的几步文本到图像扩散模型与度量分离混合精度量化
通过开发一种混合精度量化框架 MixDQ,我们针对强敏感度文本嵌入进行专门的 BOS 感知量化方法设计,通过度量解耦灵敏度分析来衡量每一层的敏感度,最后通过基于整数规划的方法进行位宽分配,与现有的量化方法相比,MixDQ 在保持 W8A8 - 潜在扩散模型的高效量化策略
本研究提出了一种高效的量化策略,利用信噪比(SQNR)作为评估指标,将相对量化噪声视为噪声,识别模型中的敏感部分,并提出了既包括全局策略又包括局部策略的高效量化方法。实验结果表明,实施全局和局部策略能够高效地量化并有效地压缩 LDMs。