Feb, 2024
基于低成本代理的混合精度自适应量化
Adaptive quantization with mixed-precision based on low-cost proxy
TL;DR该论文提出了一种名为LCPAQ的新型模型量化方法,其中包含三个关键模块。在考虑硬件限制的基础上设计了硬件感知模块,开发了自适应混合精度量化模块来评估量化灵敏度,并使用希狄矩阵和Pareto边界技术进行整数线性规划来微调不同层的量化。然后,低成本代理神经架构搜索模块高效探索理想的量化超参数。在ImageNet上的实验证明,提出的LCPAQ在量化精度方面达到了与现有混合精度模型相当甚至更好的水平。值得注意的是,与现有方法相比,LCPAQ的搜索时间减少了1/200,从而为资源有限设备的实际量化使用提供了捷径。