Jun, 2020
APQ: 网络架构、剪枝和量化策略联合搜索
APQ: Joint Search for Network Architecture, Pruning and Quantization
Policy
TL;DRAPQ是一种用于在资源受限的硬件上高效进行深度学习推理的方法,通过联合优化神经架构、修剪策略和量化策略来处理设计空间更大的问题,同时利用全精度准确度预测器向量化至量化准确度预测器以大幅提高样本效率,其在ImageNet上的实验结果表明其可以以更低延迟/能耗降低2倍/1.3倍的前提下获得与项代号MobileNetV2+HAQ相当的准确性,并比代号为ProxylessNAS+AMC+HAQ的分别优化方法实现更高达2.3%的准确率,同时大幅减少GPU时数和CO2排放。