Oct, 2023

ROAM:通过优化操作符顺序和内存布局实现高效的内存节约的大规模 DNN 训练

TL;DRROAM 提出了一种在计算图级别上操作,以得到内存有效的执行计划,包括优化的运算符顺序和张量内存布局,用于模型。ROAM 相对于 Pytorch 和两种最新方法能够显著降低 35.7%、13.3% 和 27.2% 的内存需求并达到了惊人的 53.7 倍加速。