BriefGPT.xyz
大模型
Ask
alpha
关键词
layernorms
搜索结果 - 1
EMNLP
参数高效微调中 Transformer 模块的迁移性实证研究
本文旨在通过 fine-tuning 各种 transform 的模块,找寻最优子网络并探究不同 transformer 模块在将知识从预训练模型传输到下游任务方面的能力,结果显示其中的 LayerNorms 具有最佳的限制可训练参数数量和
→
PDF
a year ago
Prev
Next