Aug, 2024
Optimus: 通过气泡利用加速大规模多模态LLM训练
Optimus: Accelerating Large-Scale Multi-Modal LLM Training by Bubble
Exploitation
TL;DR本研究解决了现有多模态大语言模型(MLLM)训练效率低下的问题,主要由于GPU的气泡现象和复杂的数据依赖性。论文提出了一种新的分布式MLLM训练系统Optimus,通过优化编码器计算调度,显著减少训练时间,实验结果显示,Optimus能使MLLM训练速度提升20.5%-21.3%。