ICLRFeb, 2022

SQuant: 基于对角 Hessian 近似的即时数据无关量化

TL;DR本篇论文提出了一种名为 SQuant 的实时数据无需模型压缩框架,采用三对角线子项目组合构成新颖的无数据最优化目标解算法,同时设计了一个有效的算法来进一步减少目标求解的计算复杂度。实验结果表明,SQuant 不需要微调和合成数据集,可以将数据无需量化过程加速到次秒级,并且在 4-bit 量化下,精度比现有数据无需压缩方法提高了 30% 以上