Feb, 2024

面向重参数化模型的准确后训练量化

TL;DR通过使用平均绝对误差作为评估指标,我们提出了一种新的框架 RepAPQ,它有效地保持了量化再参数化模型的准确性,并通过量化保护再参数化和跨块校准的组件实现了更好的模型性能。实验证明,我们的方法在各种模型和任务上都优于以前的方法,8 位 PTQ 的提升约为 1%,6 位 PTQ 的提升约为 2%。