Jun, 2024

低秩适应中的子空间混合

TL;DR本文介绍了一种基于子空间的低秩适应方法(LoRA),该方法在计算效率、实施简易性和适用性方面具有优势,可广泛应用于大型语言、多模态和扩散模型;通过子空间的微观视角,我们发现混合两个子空间可以提升性能,并通过与原始 LoRA 权重共同学习混合器,进一步灵活性地实现该方法,称之为混合子空间 LoRA(MoSLoRA);在不同模态的任务中,包括常识推理、视觉指令微调和基于主题的文本到图像生成,MoSLoRA 始终表现出色,验证了其有效性和稳健性。