CVPRJun, 2023

PaReprop: 快速并行可逆反向传播

TL;DR本研究提出了 PaReprop 算法,该算法能够在反向传播阶段中将激活重新计算的额外计算开销与梯度计算本身并行化,实现记忆高效训练,并比普通可逆训练达到高达 20% 的更高训练吞吐量。