神经网络的框架量化

Apr, 2024

Frame Quantization of Neural Networks

Wojciech Czaja, Sanghoon Na

TL;DR我们提出了一种基于来自框架理论的思想的后训练量化算法，特别是我们使用一阶Sigma-Delta量化来量化神经网络中的权重矩阵和偏差。在我们的情景中，我们推导了原始神经网络和量化神经网络之间的误差界限，其中考虑了步长和框架元素数量。我们还展示了如何利用框架的冗余性来实现更高精度的量化神经网络。

Abstract

We present a post-training quantization algorithm with error estimates relying on ideas originating from frame theory. Specifically, we us

发现论文，激发创造

深度卷积网络的量化优化：一篇白皮书

本文概述了卷积神经网络量化技术，研究发现通过对权重和激活进行逐通道和逐层量化，即使在不支持8位运算的情况下，将权重量化为8位可以将模型大小降低4倍，并且分类的准确率可以达到浮点型卷积神经网络的98%。作者介绍了针对CPU和DSP的量化网络的等待时间基准测试，并观察到相比于CPU上的浮点运算，量化实现的速度提高了2倍至3倍。作者提出了一种通过TensorFlow和TensorFlowLite进行卷积网络量化的工具，并回顾了用于量化训练的最佳实践。作者建议，对于硬件加速和内核优化，应将逐通道量化的权重和逐层量化的激活作为首选量化方案，并提议未来处理器和硬件加速器用于优化推断时支持4、8和16位的精度。

Jun, 2018

LQ-Nets: 针对高准确性和紧凑型深度神经网络的学习量化

本文提出了一种用于深度神经网络（DNN）压缩的联合训练方法，以便同时训练量化器和DNN，以便量化网络权重和激活，并提高量化模型的预测准确性。在CIFAR-10和ImageNet数据集上进行的全面实验显示，该方法在各种网络结构上都运行良好，超越了以前的量化方法。

Jul, 2018

量化网络

该论文提出了一种将低位量化作为可微非线性函数的新方法，并通过该方法实现了神经网络的低位量化，并取得了比现有方法更好的效果。

Nov, 2019

神经网络的最小二乘二值化

本文提出了一种新的二进制量化方式，使用该方式可以提高神经网络的推断效率，并在ImageNet数据集上进行了实验验证。

Jan, 2020

用于量化鲁棒性的梯度L1正则化

本文研究了神经网络中权重和激活量化的影响，提出了一种简单的正则化方案来提高其对培训后量化的适应性。通过训练量化-ready的网络，我们的方法可以存储一组可按需量化为不同位宽的权重。我们将量化建模为有界扰动，并使用梯度的L1范数来对其进行正则化，实验证明了我们该方案的有效性。

Feb, 2020

改进后训练神经量化：逐层校准与整数规划

本文研究使用后训练量化方法达到低于8位的精度损失和模型压缩，采用分层次优化参数和整数规划方案，性能在视觉和文本模型上最优。

Jun, 2020

高效神经网络推理量化方法综述

本文旨在综述深度神经网络计算中数值量化的方法和优缺点，囊括了使用固定整数值的优点、及降低4x到8x等现实应用中的实际结果，以及占用更少的内存和降低延迟的潜力。

Mar, 2021

具有可证明保证的神经网络后训练量化

本研究提出了一种针对神经网络量化的方法，该方法通过量化权重来降低计算成本、内存占用和功耗，并促进权重的稀疏性，使用本方法在ImageNet上测试显示准确性的损失很小。

Jan, 2022

SPFQ：一种用于神经网络量化的随机算法及其误差分析

本文提出了一种快速随机算法来对完全训练的神经网络权重进行量化，建立了全网络错误边界，证明了过参数化程度增加时相对平方量化误差呈线性衰减，同时展示了在每个权重上仅使用O(log(log N))位可以达到等同于无穷字母表情况下的错误边界。

Sep, 2023

QGen：关于量化感知训练的泛化能力

使用更少的位数表示模型权重和激活，量化降低了内存使用、计算需求和延迟。我们研究了量化神经网络的泛化性质，首先通过理论模型表明了量化作为一种正则化的功能，其次通过与损失函数曲线陡峭度与泛化的相关性的研究，提出了一个近似限制量化模型泛化性的方法，通过在CIFAR-10、CIFAR-100和ImageNet数据集上对卷积和Transformer模型进行超过2000次实验进行验证。

Apr, 2024