CVPRMay, 2021

Pareto-Optimal Quantized ResNet 可优化量化为主要 4 位

TL;DR研究表明,使用 4 位和 8 位模型量化的 bfloat16 ResNet 模型计算成本和准确性的权衡曲线优于 bfloat16 模型,其中以 4 位模型量化为主的模型具有最佳 Pareto 曲线,并且基于量化感知训练的 4 位 ResNet-50 模型在 ImageNet 上取得了 77.09%的准确率。