Jan, 2024

RoSA:鲁棒适应实现准确的参数高效微调

TL;DR我们研究了能够在计算和内存有限的情况下提供良好准确度的参数高效调整方法(PEFT),我们提出了一种新的PEFT方法称为Robust Adaptation(RoSA),通过在一组固定的预训练权重之上联合训练低秩和高度稀疏的组件,有效地逼近全精调(FFT)解决方案的性能,在需要进行精细调整以获得良好性能的挑战性生成任务中,如小学数学和SQL查询生成,我们展示了RoSA优于LoRA和纯稀疏调整在相同参数预算下的性能。我们为RoSA提供系统支持,以在训练算法中补充,具体为稀疏GPU内核,实现内存和计算上的高效训练。我们的代码将在https://github.com/IST-DASLab/RoSA上提供。