BriefGPT.xyz
Ask
alpha
关键词
sparse high rank adapters
搜索结果 - 1
稀疏高秩适配器
本文提出了基于稀疏高秩适配器 (SHiRA) 的新范式,通过直接调整基模型权重的 1-2% 来训练高度稀疏的适配器,以在融合模式下实现无推理开销、快速切换和显著降低概念损失的效果。对 LVMs 和 LLMs 的广泛实验表明,仅微调基模型的一
→
PDF
17 days ago
Prev
Next