BriefGPT.xyz
Ask
alpha
关键词
anti-forgetting strategies
搜索结果 - 1
大型语言模型调优中重新思考灾难性遗忘
本文首次揭示了大型语言模型(LLMs)的模型损失面与遗忘程度之间的直接联系,并引入了锐度感知最小化方法来减轻 Catastrophic Forgetting,通过使损失面变得平坦。实验证明该方法在缓解 Catastrophic Forget
→
PDF
a month ago
Prev
Next