Jan, 2024

MPTQ-ViT:VisionTransformer的混合精度后训练量化

TL;DR提出了SmoothQuant with bias term (SQ-b)和optimal scaling factor ratio search (OPT-m)方法以及一种多精度后训练量化框架(MPTQ-ViT),在ImageNet数据集上进行的实验表明,与现有方法相比,所提方法在4位和5位量化的ViTs上均取得了显著的准确度提高。