ICMLJun, 2023

FlexRound: 基于元素除法的可学习取整,用于后训练量化

TL;DR本研究提出了一种名为 FlexRound 的新的权重取整机制,通过元素除法实现对预训练权重的灵活量化,可以一起学习一个公共的量化网格大小以及每个预训练权重的不同比例。实验结果表明,该机制用于后训练量化可以有效提高模型性能,并且还可以在图像分类、自然语言理解和生成等多个领域实现量化。