BriefGPT.xyz
Ask
alpha
关键词
layer-wise penalty
搜索结果 - 1
AAAI
一步学习,一步评议
我们提出了一种名为 OLOR(One step Learning, One step Review)的新型基于权重回滚的微调方法,结合优化器,每一步都将权重回滚项引入权重更新项,确保上下游模型的权重范围一致,有效减轻知识遗忘问题,并提高微调
→
PDF
6 months ago
Prev
Next