BriefGPT.xyz
大模型
Ask
alpha
关键词
subset of layers
搜索结果 - 1
EMNLP
关于语言编码器的手术微调
为适应新任务,研究发现只对神经语言编码器的部分层进行微调就足以获得接近甚至更好的性能,提出一种基于 Fisher 信息矩阵对候选层进行选择的高效度量指标,并通过在不同语言编码器和任务上的实验证明该指标能够有效选择层以获得强大的下游性能。
PDF
8 months ago
Prev
Next