Apr, 2024

BinaryDM: 混合扩散模型的准确二值化

TL;DR本研究提出了 BinaryDM,一种新颖的准确的量化感知训练方法,以将扩散模型的权重推向 1 位极限。使用 Learnable Multi-basis Binarizer (LMB) 来恢复二元化扩散模型生成的表示,并使用 Low-rank Representation Mimicking (LRM) 来提高二元化感知优化。通过渐进的初始化策略训练扩散模型,可以避免收敛困难。全面的实验证明,与超低位宽下的 DM 的 SOTA 量化方法相比,BinaryDM 在精度和效率上都取得了显著的改进。作为扩散模型的第一种二元化方法,BinaryDM 在具有 1 位权重和 4 位激活的情况下可实现 16.0 倍的 FLOPs 和 27.1 倍的存储节省,展示了其在资源有限场景中的巨大优势和潜力。