Jun, 2024

基于学习的子空间投影器的通用GPU上超参微调LLM的实用卸载

TL;DR通过学习稀疏压缩器和新颖的分层通信调度,我们提出了一个离线框架 LSP_Offload,能够在普通硬件上以接近原生速度进行大型语言模型的微调,从而在受限的内存条件下显著提高微调吞吐量并缩短微调时间。