Feb, 2024

用于参数高效微调的Mini-Ensemble低秩适配器

TL;DRMELoRA是一种采用较少可训练参数但保持较高秩的迷你低秩适配器,用于针对预训练大型语言模型进行性能优化的方法。实验证明,在自然语言理解和指令跟随任务上,相较于低秩适配器LoRA,MELoRA在拥有8倍较少可训练参数时表现更好,而在指令跟随任务上拥有36倍较少可训练参数时也表现更好,证明了MELoRA的有效性。