Oct, 2023
ROAM:通过优化操作符顺序和内存布局实现高效的内存节约的大规模 DNN 训练
ROAM: memory-efficient large DNN training via optimized operator ordering and memory layout
Huiyao Shu, Ang Wang, Ziji Shi, Hanyu Zhao, Yong Li...
TL;DRROAM 提出了一种在计算图级别上操作,以得到内存有效的执行计划,包括优化的运算符顺序和张量内存布局,用于模型。ROAM 相对于 Pytorch 和两种最新方法能够显著降低 35.7%、13.3% 和 27.2% 的内存需求并达到了惊人的 53.7 倍加速。