Sep, 2023

EPTQ:通过无标签海森矩阵增强的后训练量化

TL;DR本研究提出了一种增强后训练量化方法,名为 EPTQ,该方法基于层的自适应加权进行知识蒸馏。此外,我们引入了一种无标签技术用于估计任务损失的 Hessian 迹,名为 Label-Free Hessian。通过采用 EPTQ,我们在各种模型、任务和数据集上取得了最先进的结果,包括 ImageNet 分类、COCO 目标检测和 Pascal-VOC 语义分割。我们还展示了 EPTQ 在各种体系结构上的性能和兼容性,包括 CNN、Transformer、混合和仅 MLP 模型。