Mar, 2024

COMQ:一种免反向传播的用于后训练量化的算法

TL;DR采用了一种创新的PTQ算法COMQ,通过逐层坐标最小化重构误差,使得精简后的模型在不损失原始准确性的情况下高效部署