关键词moe architecture
搜索结果 - 4
  • 大型语言模型中混合专家的更深入研究
    PDF8 days ago
  • 推动专家混合模型的极限:非常参数高效的指令调优 MoE
    PDF10 months ago
  • 基于任务的 MoE 多任务多语言机器翻译
    PDF10 months ago
  • ICML利用分布专家进行终身语言预训练
    PDFa year ago
Prev
Next