ICLRMar, 2022

QDrop:一种用于极低位后训练量化的随机丢弃量化方法

TL;DR本文提出了一种新的方法,即将 activation quantization 纳入 post-training quantization 中,随机放弃激活量化,从而将 PTQ 的极限推向了 2 位。最终结果表明,QDROP 在图像分类、目标检测和文本分类任务中具有优异的表现,成为了 PTQ 现有技术中新的最佳方法。