Apr, 2021

通过伪量化噪声实现可微分的模型压缩

TL;DR本文提出了 DiffQ,一种不需要渐近梯度估计的可微方法,用于在训练期间对模型参数进行量化。DiffQ 在多个基准测试和体系结构上进行了实验验证,对于图像分类、语言建模和音频源分离等任务,能够优化每个权重或一组权重使用的位数,并在模型精度损失 0.3% 的情况下将 12 层的变压器模型压缩了超过 8 倍 。