Feb, 2024

MoELoRA: 基于对比学习引导的专家混合模型在大型语言模型的参数高效微调中的应用

TL;DR利用对比学习以鼓励专家学习不同特征的方式,我们介绍了一种新的参数效率微调方法MoELoRA,它在数学推理和常识推理基准测试中表现显著优于LoRA和GPT-3.5。