Dec, 2023

分布式学习专家混合模型

TL;DR提出了一种分布式学习方法,用于构建一个由本地估计器并行拟合数据子集所组成的大的混合专家模型,通过最小化期望的运输散度来聚合这些本地估计器,并通过提出的主导 - 最小化算法来构造一种计算规模高效的降维估计器。对实验中的统计和数值属性进行了研究,证明了所提供的降维估计器的性能优于从完整数据集中以集中方式构造的全局估计器,有些情况下计算时间比全局估计器快十倍以上,我们的源代码公开在 Github 上。