May, 2024

未选择的专家也能贡献:通过自对比释放 MoE 模型的力量

TL;DR基于 Mixture-of-Experts 和 SCMoE 的推理能力在不同领域中得到了提升。