Aug, 2024

Optimus: 通过气泡利用加速大规模多模态LLM训练

TL;DR本研究解决了现有多模态大语言模型(MLLM)训练效率低下的问题,主要由于GPU的气泡现象和复杂的数据依赖性。论文提出了一种新的分布式MLLM训练系统Optimus,通过优化编码器计算调度,显著减少训练时间,实验结果显示,Optimus能使MLLM训练速度提升20.5%-21.3%。