BriefGPT.xyz
Ask
alpha
关键词
adamole
搜索结果 - 1
AdaMoLE:使用自适应的低秩适应专家对大型语言模型进行微调
AdaMoLE 是一种通过自适应混合低秩适应(LoRA)专家的方法,用于对大型语言模型(LLMs)进行精细调节。它通过使用专用阈值网络来动态调整激活阈值,从而对不同任务的变化复杂性进行自适应响应。通过将单个 LoRA 替换为多个 LoRA
→
PDF
2 months ago
Prev
Next