BriefGPT.xyz
大模型
Ask
alpha
关键词
data distributional shifts
搜索结果 - 1
MIND:多任务增量网络蒸馏
MIND 是一种参数隔离方法,通过引入两种不同的蒸馏过程和优化网络内部的 BachNorm 层,显著提高了没有重播数据的解决方案的性能,在几个广泛研究的数据集上达到了最先进的结果,对于没有重播数据的类增量学习和域增量学习,在资源受限环境中表
→
PDF
7 months ago
Prev
Next