ICMLApr, 2021

通过 2 位激活压缩训练减少训练内存占用的 ActNN

TL;DR本文提出了一种名为 ActNN 的基于随机量化激活值实现的内存高效训练框架,该框架针对神经网络训练过程中内存不足的问题,利用分层、分维度、分样本的异质性进行多样化的量化,以达到减小内存占用和缩短训练时间的目的,Empirically 验证了 ActNN 的有效性,并表明其不会带来过大的精度损失。