BriefGPT.xyz
大模型
Ask
alpha
关键词
task-aware gating functions
搜索结果 - 1
稀疏激活的专家混合模型是具有鲁棒性的多任务学习器
使用稀疏激活的专家混合模型和任务感知门控函数结合的多任务学习方法,成功地提高了模型泛化能力、转移学习效果和鲁棒性。
PDF
2 years ago
Prev
Next