Feb, 2024

最小二乘估计在 Softmax 门限混合专家中的应用

TL;DR在本研究中,我们探究了在数据按照回归模型进行采样的确定性混合专家模型下,最小二乘估计器(LSE)的性能,并建立了称为强可辨识性的条件,以表征不同类型的专家函数的收敛行为。我们证明了广泛使用的具有激活函数 sigmoid 和 tanh 的前馈网络专家的估计速度明显快于多项式专家,后者表现出令人惊讶的缓慢估计速度。我们的研究结果对专家选择具有重要的实际意义。