Jun, 2024

频谱:信噪比目标训练

TL;DR通过选择性地针对信噪比,冻结其余模块,我们提出了一种名为 Spectrum 的方法来加速大规模语言模型的训练,同时减少了 GPU 内存的使用。实验证明,与现有方法如 QLoRA 相比,该方法在模型质量和 VRAM 效率方面具有较高的效果。