BriefGPT.xyz
大模型
Ask
alpha
关键词
dare
搜索结果 - 2
ICML
渐进分歧的无缝适应:一种新颖的领域增量学习方法
本研究提出了一种名为 DARE 的新颖 DIL 方法,通过分歧、适应和细化的三阶段训练过程,逐步将与新任务相关的表示适应到由先前任务样本所覆盖的特征空间中,并同时整合任务特定的决策边界,有效减缓了特征编码器的表示漂移,降低了多个 DIL 基
→
PDF
11 days ago
语言模型之超级马里奥:从同源模型中吸收能力如午餐一般
我们揭示了语言模型(LMs)可以通过吸收同类模型的参数而无需重新训练或使用图形处理器来获得新的能力。我们引入了一种名为 DARE(Drop And Rescale)的新操作,将绝大多数增量参数直接设为零,并可以将多个特定任务的 LM 合并为
→
PDF
8 months ago
Prev
Next