EMQ:演化的基于训练无关替代方法的自动混合精度量化
该论文提出了一种名为 LCPAQ 的新型模型量化方法,其中包含三个关键模块。在考虑硬件限制的基础上设计了硬件感知模块,开发了自适应混合精度量化模块来评估量化灵敏度,并使用希狄矩阵和 Pareto 边界技术进行整数线性规划来微调不同层的量化。然后,低成本代理神经架构搜索模块高效探索理想的量化超参数。在 ImageNet 上的实验证明,提出的 LCPAQ 在量化精度方面达到了与现有混合精度模型相当甚至更好的水平。值得注意的是,与现有方法相比,LCPAQ 的搜索时间减少了 1/200,从而为资源有限设备的实际量化使用提供了捷径。
Feb, 2024
本研究提出了一种名为 DQMQ 的新型混合精度量化框架,可动态地适应不同数据质量,通过学习一个决策规则,它被建模为一种混合强化学习任务,该任务结合了基于模型的策略优化和监督量化训练。通过在混合质量的图像数据集上进行训练,DQMQ 可以在面对不均匀输入质量时隐式地选择每个层的最适宜比特宽度,在各种基准数据集和网络上的大量实验表明,DQMQ 比现有的固定 / 混合精度量化方法更为优越。
Feb, 2023
APQ 是一种用于在资源受限的硬件上高效进行深度学习推理的方法,通过联合优化神经架构、修剪策略和量化策略来处理设计空间更大的问题,同时利用全精度准确度预测器向量化至量化准确度预测器以大幅提高样本效率,其在 ImageNet 上的实验结果表明其可以以更低延迟 / 能耗降低 2 倍 / 1.3 倍的前提下获得与项代号 MobileNetV2+HAQ 相当的准确性,并比代号为 ProxylessNAS+AMC+HAQ 的分别优化方法实现更高达 2.3%的准确率,同时大幅减少 GPU 时数和 CO2 排放。
Jun, 2020
提出使用网络正交性作为网络量化的代理指标,使用线性规划优化代理指标,降低搜索时间和数据依赖性,从而实现高效且准确的网络量化,分别在 ResNet-18 和 MobileNetV2 上实现了 72.08% 和 71.27% 的 Top-1 准确率。
Sep, 2021
本文提出了一种基于深度强化学习的硬件感知自动量化框架 (HAQ),旨在为不同的神经网络体系结构和硬件体系结构确定最佳的量化策略,以提高计算效率并在保持准确性的前提下减少延迟和能耗。 在硬件仿真器的帮助下,该框架的有效性已得到证明。
Aug, 2020
提出了一种名为 Mixture of Quantized Experts (MoQE) 的简单权重量化方法,可以降低 Mixture of Experts (MoE) 模型的内存消耗和延迟问题,同时保持可靠的模型性能,并可在大多数情况下显著减小模型大小。
Oct, 2023
该研究提出利用量化器中的可学习参数作为量化精度重要指标,通过一次整数线性规划来确定混合精度量化的最佳位宽以提高时间效率,并在多种模型中实现了 SOTA 精度。
Mar, 2022
提出了一种名为 QBitOpt 的算法,通过量化感知训练(QAT)期间更新比特宽度,将位宽分配问题转化为约束优化问题,利用快速计算的灵敏度和高效求解器,生成满足严格资源约束的高性能任务的混合精度网络。在常见的位宽约束下,在 ImageNet 上评价 QBitOpt 并证实了在固定和混合精度方法中的优越性。
Jul, 2023
本文提出了 HMQ,一个基于 Gumbel-Softmax 估计器的混合精度量化块,搜索有限的量化方案空间,以覆盖在边缘设备硬件实现中需要的均匀和具有 2 的幂级别阈值的量化器需求,并在 CIFAR10 和 ImageNet 训练的分类模型上应用 HMQ,证明在一些情况下,虽然添加了限制,但也能够实现竞争性和最先进的结果。
Jul, 2020