Feb, 2024

QDyLoRA:用于高效大型语言模型调优的量化动态低秩自适应

TL;DRQLoRA和QDyLoRA是一种用于大型语言模型的有效量化方法,能够在GPU内存限制下进行适应性微调,并在寻找适合的低秩参数方面具有竞争力。