Feb, 2025

QLess: 一种用于大语言模型微调的数据估值与选择的量化方法

TL;DR本研究解决了在大语言模型微调中,由于处理庞大数据集的计算成本限制而导致的数据选择效率问题。提出的QLess方法结合了梯度量化与LESS框架,通过两步压缩过程,在保持较低内存使用的同时实现相似的数据选择性能。实验结果表明,即使是1位梯度量化,QLess在数据估值质量上也有显著保留,展现了其实用的可扩展性。