May, 2023

高斯专家混合模型中的 Softmax 门控解密

TL;DR通过引入新的 Vononoi 损失函数,建立最大似然估计器的收敛速度,解决了 softmax gating 高斯混合专家的参数估计中的三种理论挑战。