低精度训练中的内存与误差权衡

ICLRJun, 2021

How Low Can We Go: Trading Memory for Error in Low-Precision Training

Chengrun Yang, Ziyang Wu, Jerry Chee, Christopher De Sa, Madeleine Udell

TL;DR本文提出一种基于 Pareto 估计的技术 (Pareto Estimation to Pick the Perfect Precision，PEPPP)，使用矩阵分解来查找非支配配置 (即 Pareto 前沿)，以在有限数量的网络评估下找到最小化错误的精度，从而解决低精度算术训练深度学习模型中的超参数调节问题。

Abstract

low-precision arithmetic trains deep learning models using less energy, less memory and less time. However, we pay a price for the savings: lower precision may yield larger round-off error and hence larger predic

low-precision arithmetic deep learning hyperparameter tuning pareto estimation matrix factorization

发现论文，激发创造

有限数值精度下的深度学习

该研究探讨有限精度数据表示和计算对神经网络训练的影响，并通过使用随机舍入的低精度定点计算方法在 16 位宽度的数据表示下训练深度网络来减少能量消耗并获得高分类准确性。

Feb, 2015

深度神经网络有界内存的降低精度策略

该研究考虑了使用不同精度数据的卷积神经网络对其分类准确性的影响，发现误差容限不仅在不同网络之间有差异，而且在网络内部也有变化；进一步提出了一种方法，可以找到网络的低精度配置，同时保持高准确性。研究表明，相对于在所有层中使用 32 位浮点表示的传统实现，数据足迹可以平均减少 74％，最高可降至 92％，而相对准确性损失不到 1％。

Nov, 2015

探究精度量化对神经网络准确度和能耗的影响

本研究探讨神经网络中不同位精度 (bit-precision) 对网络精度、硬件指标 (存储、功耗、设计面积)、能量消耗等的影响，并提出训练时间方法来弥补位精度降低精度所导致的误差，并表明在降低精度的情况下，可以在设计指标中获得显著的益处，同时提出可以通过增加网络大小来提高精度。

Dec, 2016

使用低精度乘法训练深度神经网络

通过在三个基准数据集上使用三种不同的格式（浮点数、固定点和动态固定点）进行训练，评估乘法精度的影响，研究发现，即使在训练神经网络时使用 10 位乘法，非常低的精度也足够运行和训练最新的神经网络。

Dec, 2014

内存高效的混合精度优化器

传统优化方法依赖于使用单精度浮点算术，在内存大小和计算性能方面具有成本。然而，混合精度优化技术利用单精度和半精度浮点算术来降低内存需求，同时保持模型准确性。我们在训练模型期间提供了一种算法，通过摆脱参数的浮点副本，实际上只保留半精度数，进一步减少内存使用。我们还通过在反向传播期间执行优化器步骤来探索去除梯度值的好处。在实践中，我们实现了高达 25% 的峰值内存使用降低和 15% 的更快训练速度，同时保持相同水平的准确性。

Sep, 2023

混合精度训练

介绍了一种使用半精度浮点数训练深度神经网络的技术，通过减少内存消耗和利用未来处理器的半精度硬件单元，大幅提高模型训练的计算速度。

Oct, 2017

使用 8 位浮点数进行混合精度训练

本文介绍了一个使用 8 位浮点表示法训练深度神经网络的方法，减少计算精度和主权重复制的精度要求，并且通过强化误差传播和降低量化噪声的方法来提高模型性能。实验表明，所提出方法在多个数据集和不同工作负载下与精度基线相比不降反升。

May, 2019

通过随机化实现少量 RAM 的大规模学习

采用随机化分离技术，将权重向量投影到粗离散集上，从而将流行的大规模在线学习方法的内存占用量降低 50% 以上；采用随机计数可以实现每个坐标单独的学习速率，具有很好的内存性能表现。这些内存节省方法的效果与精确的变体相当，且实验证明这些方法在内存与精度的权衡方面具有出色的性能。

Mar, 2013

反向传播算法的逐张量定点量化

通过精度分配方法，实现神经网络中所有参数的最小化，从而实现固定点训练。针对 CIFAR-10，CIFAR-100 和 SVHN 数据集，对四个网络进行实验验证，证实此方法具有接近最优的精度分配，可以与其他固定点神经网络设计相比较。（The precision assignment methodology reduces the complexity of fixed-point training for neural networks, and its optimality is validated empirically for various datasets and network designs）

Dec, 2018

ZipML 框架：端到端低精度模型训练：能与不能兼备，再加一点深度学习

该论文探讨了在低精度下使用机器学习模型进行训练的可行性，提出了一种名为 ZipML 的框架，通过双重采样策略实现线性模型的低精度训练，避免了由于量化导致的引入偏差问题，并在各种应用场景中进行了验证。同时，通过使用方差优化的随机量化策略，在包括非线性模型在内的多种情况下，得出了有关低精度机器学习的重要结论和实用价值。

Nov, 2016