Feb, 2023

低位视觉 Transformer 的无振荡量化

TL;DR研究了量化感知训练中的重量振荡,发现可学习缩放因子会加剧重量振荡,并因此提出三种技术有效地减轻重量振荡并在 Imagenet 上显著提高了准确率。