用于内存优化的 DNN 训练的原地激活批量归一化

Dec, 2017

用于内存优化的 DNN 训练的原地激活批量归一化

In-Place Activated BatchNorm for Memory-Optimized Training of DNNs

Samuel Rota Bulò, Lorenzo Porzi, Peter Kontschieder

TL;DR本文提出了 InPlace-ABN 的方法，通过替代传统的 BatchNorm 和 Activation 层，以及在反向传播中恢复所需的信息来减少现代深度神经网络的占用内存，从而实现对已有深度学习框架的方便应用。使用该方法进行图像分类时，我们在 ImageNet-1k 上展示出与其他先进方法相当的结果，并在 COOC-Stuff、Cityscapes 和 Mapillary Vistas 等需要占用大量内存的语义分割任务中取得了最新的、与单尺度、单模型情况下的最佳结果。

Abstract

In this work we present In-Place Activated batch normalization (inplace-abn) - a novel approach to drastically reduce the training memory footprint of modern →

inplace-abn batch normalization deep neural networks memory reduction image classification

发现论文，激发创造

在 BN 反向传播中稳定批统计量

本文提出一种新的归一化方法，即移动平均批量归一化（MABN），可以在小批量情况下完全恢复基本 BN 的性能，并且在推理过程中不需要引入任何额外的非线性操作，此方法通过理论分析和实验演示了其有效性。

Jan, 2020

记忆批归一化的双向传播

本文提出了一种基于多个最近批次来获取更准确、更稳健统计的 Memorized Batch Normalization (MBN)，并使用 Double-Forward scheme 来缓解分布漂移问题，相较于现有的方法，在训练和推理中表现更加稳定，并显著提高了模型的泛化性能。

Oct, 2020

BNN - BN = ?：无需批量归一化训练二元神经网络

通过采用自适应梯度剪切、比例重量标准化和专门的瓶颈块等技术，本研究将 BN-Free 训练的框架扩展到二进制神经网络训练，并首次证明可以完全从 BNN 的训练和推断中去除 BN 层，而不会丧失性能。

Apr, 2021

实用域自适应的 Batch Normalization 重新审视

本文提出了一种称为自适应批量归一化（AdaBN）的方法来提高深度神经网络的泛化能力，无需额外组件或参数，并证明其在领域适应任务和现有方法相结合时具有卓越的性能表现。

Mar, 2016

用 L1 范数批量归一化高效训练深度神经网络

本文提出了一种仅利用线性操作来实现前向和后向传递的 L1-norm BN 方法，该方法与原始 L2-norm BN 方法在准确度和收敛速度上相当，但具有更高的计算效率和硬件友好性，可以通过低比特宽度量化技术实现全量化训练，进一步提高深度神经网络的训练速度和能效。

Feb, 2018

理解批标准化

本文旨在通过实证研究向更好地理解批归一化的原理和机制迈出一步，证明批归一化主要实现了更大学习率的训练，这是更快收敛和更好泛化的原因。

Jun, 2018

用于对抗鲁棒性的自适应批标准化网络

通过自适应批归一化网络（ABNN）设计一种不基于对抗训练但仍然能够抵御强对抗攻击的防御方法，以提高对抗性鲁棒性并在图像和视频数据集上实现更高的清洁数据性能和显著降低训练时间复杂度。

May, 2024

通过 2 位激活压缩训练减少训练内存占用的 ActNN

本文提出了一种名为 ActNN 的基于随机量化激活值实现的内存高效训练框架，该框架针对神经网络训练过程中内存不足的问题，利用分层、分维度、分样本的异质性进行多样化的量化，以达到减小内存占用和缩短训练时间的目的，Empirically 验证了 ActNN 的有效性，并表明其不会带来过大的精度损失。

Apr, 2021

批量卡尔曼归一化：向使用微批次训练深度神经网络迈进

本文提出了一种称为 Batch Kalman Normalization（BKN）的新型规范化方法，通过考虑其前面所有层的分布来估计某个层的统计信息来改善和加速训练深度神经网络，特别是在微批处理的情况下，实现了更稳定的训练和更快的收敛速度。

Feb, 2018

批量标准化：通过减少内部协变量漂移加速深层神经网络训练

该论文讨论了深度神经网络训练中的内部协变量漂移问题，并通过在模型架构内加入标准化方法及在每个训练 mini-batch 的操作中进行标准化，解决了此问题，在 Image Classification 上取得了优秀的表现。

Feb, 2015