Jun, 2024

稀疏高秩适配器

TL;DR本文提出了基于稀疏高秩适配器 (SHiRA) 的新范式,通过直接调整基模型权重的 1-2% 来训练高度稀疏的适配器,以在融合模式下实现无推理开销、快速切换和显著降低概念损失的效果。对 LVMs 和 LLMs 的广泛实验表明,仅微调基模型的一小部分参数对许多任务已经足够,并且可以同时实现快速切换和多适配器融合。