Sep, 2024

DilateQuant:通过权重扩展实现准确高效的扩散量化

TL;DR本研究解决了扩散模型在低比特量化中准确性与效率难以兼得的问题。作者提出了一种新颖的量化框架DilateQuant,利用未饱和的通道权重通过权重扩展(WD)来缩小激活范围,从而简化激活量化,并使用时间并行量化器(TPQ)和块级知识蒸馏(BKD)进一步提升性能。研究的关键发现是,WD能够有效降低激活量化误差,显著提高模型性能同时保持效率。