Jun, 2024

ProTrain: 基于记忆感知技术的高效LLM训练

TL;DRProTrain通过协调内存、计算和IO,采用分块模型状态管理和块状激活管理,在不改变训练算法的情况下,通过内存感知的运行时分析器智能平衡内存使用和性能,相较于其他最佳训练系统,ProTrain提高了1.43倍至2.71倍的训练吞吐量。