Oct, 2023

QFT:量子化的低资源LLM全参数调整

TL;DR提出了一种名为QFT的新型量化全参数调优框架,可以实现内存高效调优而不损害性能。该框架采用高效的Lion优化器和整数值量化的模型状态存储方法,并提供了梯度流和参数更新方案。结果表明,QFT将模型状态内存减少到标准解决方案的21%,同时达到可比较的性能,例如,调优LLaMA-7B模型仅需30GB内存,一张A6000 GPU即可满足。