Aug, 2023

FLIQS: 单次混合精度浮点数与整数量化搜索

TL;DR量化已成为现代深度神经网络的主流压缩技术,本文提出了一种一次性的混合精度量化搜索方法,通过整数和低精度浮点模型在不需要重新训练的情况下提高了ResNet-18和ResNet-50在ImageNet上的准确性,并探索了混合精度浮点搜索和量化与神经架构空间的联合搜索。