May, 2023

通过权重残差的低阶逼近实现精调模型的高效存储

TL;DR通过权重残差的低秩特性,本文提出了一种高效的存储 fine-tuned 模型的方法,称为 Efficient Residual Encoding(ERE),通过低秩权重残差的逼近来实现 fine-tuned 模型权重的高效存储,并通过使用额外的量化和分层秩分配来分析权重残差的健壮性并推进存储效率上限。实验结果表明,ERE 方法在各种任务和模态下显着减少内存占用并保持性能,代码已发布。