BriefGPT.xyz
Ask
alpha
关键词
homeostatic-proximal loss
搜索结果 - 1
通过专家混合实现激活稀疏性分解用于持续测试时间适应
利用 Mixture-of-Activation-Sparsity-Experts 将神经激活分解为高激活和低激活成分,结合领域信息和自适应特征选择阈值,通过引入 Homeostatic-Proximal 损失解决了模型连续适应中的问题,从
→
PDF
a month ago
Prev
Next