KDDJun, 2023

使用树和局部搜索学习带基数约束的专家混合模型

TL;DR本文提出了一种新的稀疏门控机制 COMET 以及一种置换局部搜索方法,应用于稀疏 Mixture-of-Experts 框架,这种方法在推荐系统、自然语言处理等领域进行大规模实验,取得了良好的效果。