BriefGPT.xyz
大模型
Ask
alpha
关键词
delta parameters
搜索结果 - 2
鲁棒变换器方法的小样本增量学习
在本研究中,提出了一种鲁棒的变换器方法(ROBUSTA)来解决少样本分类增量学习问题,其中利用随机分类器、稳定训练过程的批归一化层以及小任务特定可训练参数(delta parameters)来克服过拟合和遗忘问题,并通过非参数方法推断模型预
→
PDF
2 months ago
语言模型之超级马里奥:从同源模型中吸收能力如午餐一般
我们揭示了语言模型(LMs)可以通过吸收同类模型的参数而无需重新训练或使用图形处理器来获得新的能力。我们引入了一种名为 DARE(Drop And Rescale)的新操作,将绝大多数增量参数直接设为零,并可以将多个特定任务的 LM 合并为
→
PDF
8 months ago
Prev
Next