BriefGPT.xyz
Ask
alpha
关键词
sema
搜索结果 - 2
基于适配器混合的预训练模型自我扩展的持续学习
自我扩展且具模块化适应的预训练模型的细调方法 (SEMA) 在连续学习中自动决定何时重用或添加适配器模块,并根据不同表示层检测到的剧烈分布变化来进行适应,通过比较基于视觉转换的连续学习适应方法,证明了该框架优于当前最先进的方法且无需记忆回放
→
PDF
3 months ago
Switch EMA:提供更好平缓度和锐度的免费午餐
利用一行修改将 EMA 参数切换到原始模型并揭示了 Switch EMA(SEMA)的充分潜力,该方法能够帮助深度神经网络在平坦性和尖锐性之间取得更好的泛化最优解,并通过基于视觉和语言数据集的比较实验证实了 SEMA 的有效性。
PDF
5 months ago
Prev
Next