AAAIFeb, 2024

QDyLoRA:用于高效大型语言模型调优的量化动态低秩自适应

TL;DRQLoRA 和 QDyLoRA 是一种用于大型语言模型的有效量化方法,能够在 GPU 内存限制下进行适应性微调,并在寻找适合的低秩参数方面具有竞争力。