Aug, 2024

面向分布友好和异常值感知的后训练量化方法:DopQ-ViT

TL;DR本研究针对视觉变换器(ViTs)在后训练量化(PTQ)中面临的准确性下降问题,提出了一种新的量化方法DopQ-ViT。该方法引入了分布友好的Tan量化器(TanQ)和优化的缩放因子搜索(SOSF),有效解决了后Softmax激活的能力法则分布适应性不足和 LayerNorm 后激活的异常值影响,从而显著提升了低比特设置下的量化模型性能。