BriefGPT.xyz
Ask
alpha
关键词
adaptation modules
搜索结果 - 2
卷积旁路更好的视觉 Transformer 适配器
本文提出使用卷积旁路(Convpass)在预训练的 Vision Transformer 中作为适应模块,这个方法只需要少量可训练参数即可适应大型 Vision Transformer,其表现优于当前的适应模块,并证明为了适应视觉模型需要定
→
PDF
2 years ago
EMNLP
AdaMix: 参数高效模型调整的自适应混合
本文提出 AdaMix 作为一种通用的参数高效微调方法,通过调整每个 Transformer 层中引入的自适应模块的混合来提高下游自然语言理解和生成任务的性能。这种方法只对 0.1-0.2%的 PLM 参数进行微调,可以超越目前的各种参数高
→
PDF
2 years ago
Prev
Next