May, 2024

通过专家混合实现激活稀疏性分解用于持续测试时间适应

TL;DR利用 Mixture-of-Activation-Sparsity-Experts 将神经激活分解为高激活和低激活成分,结合领域信息和自适应特征选择阈值,通过引入 Homeostatic-Proximal 损失解决了模型连续适应中的问题,从而在分类和分割任务中达到了最先进的性能。