关键词sparsely-gated mixture-of-experts
搜索结果 - 3
  • JetMoE:以 0.1M 美元达到 Llama2 性能
    PDF3 months ago
  • 加速混合专家模型的快速连通专家并行
    PDF3 months ago
  • 稀疏专家混合下的视觉语言模型扩展
    PDFa year ago
Prev
Next