关键词sparse mixture-of-experts
搜索结果 - 6
- 探索稀疏专家混合模型在多领域神经机器翻译中的潜力PDF5 days ago
- 高效的专家修剪用于稀疏的专家混合语言模型:提升性能和减少推理成本PDF5 days ago
- 稠密专家混合模型的泛化误差分析:初步研究PDF3 months ago
- 分散实施的混合专家PDF4 months ago
- HyperRouter: 面向稀疏专家混合的高效训练和推理PDF7 months ago
- KDD使用树和局部搜索学习带基数约束的专家混合模型PDFa year ago
Prev
Next