Jun, 2024

通过动态参数调整彻底改变大型语言模型训练

TL;DR在大语言模型时代,提高计算资源的有效利用需求变得非常重要。本文基于LoRA精调方法,引入了一种新颖的参数高效训练技术,通过频繁改变可训练参数的一部分,提高了有效的预训练。我们的方法不仅在预训练阶段实现了内存和计算开销减少,与当前最先进的参数高效算法相当,而且保持了与完全预训练相当的准确性水平。我们提供了理论分析和实证证据来证明我们的方法的有效性。