May, 2024
LoQT: 低秩适配模块用于量化训练
LoQT: Low Rank Adapters for Quantized Training
Sebastian Loeschcke, Mads Toftrup, Michael J. Kastoryano, Serge Belongie, Vésteinn Snæbjarnarson
TL;DRLoQT是一种用于高效训练量化模型的方法,它使用基于梯度的张量分解来初始化可训练的低秩权重矩阵,并周期性地合并到量化全秩权重矩阵中。我们发现LoQT使得在消费级24GB GPU上能够高效地训练高达7B参数的模型,并且还展示了在相同硬件上使用逐层梯度更新训练13B参数模型的可行性。