Jun, 2024

高效神经压缩与推理时间解码

TL;DR通过混合精度量化、零点量化和熵编码将 Resnets 的压缩边界推进到 1 位以外,在 ImageNet 基准测试中准确度下降不超过 1%。