BriefGPT.xyz
Ask
alpha
关键词
efficient model adaptation
搜索结果 - 2
从 PEFT 到 DEFT:在 Transformer 中减少激活密度的参数高效微调
本研究提出了一种新的密度损失方法,促进预训练模型中更高的激活稀疏性,从而实现有效的模型自适应。实验证明,使用我们的方法 DEFT 在不降低下游任务性能的情况下,可以在 RoBERTa_Large 上减少激活密度达到 50.72%,在 Fla
→
PDF
5 months ago
大规模视觉变压器通过适配器重新组合的高效适应
高容量预训练模型的出现改变了计算机视觉中的问题解决方式,专注于训练特定任务的模型转变为调整预训练模型,因而有效地将大型预训练模型适应下游任务成为一个重要的研究领域;本研究提出了一种新颖的适配器重组(ARC)策略,从新的角度解决了高效预训练模
→
PDF
9 months ago
Prev
Next